Search
Search titles only
By:
Search titles only
By:
Log in
Register
Search
Search titles only
By:
Search titles only
By:
Menu
Install the app
Install
Forums
New posts
All threads
Latest threads
New posts
Trending threads
Trending
Search forums
What's new
New posts
New ads
New profile posts
Latest activity
Free Ads
Latest reviews
Search ads
Members
Current visitors
New profile posts
Search profile posts
Contact us
Latest ads
Colombo
Red Hat Certified System Administrator (RHCSA) - RHEL 10
Sanjeewani95
Updated:
Friday at 7:43 PM
NURSING , CAREGIVER , HOTEL & BEAUTY COURSES
IVA Para Medical Campus
Updated:
Thursday at 9:24 AM
Handmade Character Soft Toys Peppa Pig Family
anil1961
Updated:
Wednesday at 9:58 PM
Ad icon
Video Content Creator
pramukag
Updated:
Jun 28, 2026
Ad icon
QA Engineer Intern
pramukag
Updated:
Jun 28, 2026
Electronics
Vehicles
Property
Search
Reply to thread
Forums
General
Education
How to working with robots.txt
Get the App
JavaScript is disabled. For a better experience, please enable JavaScript in your browser before proceeding.
You are using an out of date browser. It may not display this or other websites correctly.
You should upgrade or use an
alternative browser
.
Message
<blockquote data-quote="lahiruyasintha" data-source="post: 21635073" data-attributes="member: 312308"><p style="text-align: center"><img src="http://www.nikhilchandra.in/wp-content/uploads/2013/07/how-to-use-robots-txt.png" alt="" class="fr-fic fr-dii fr-draggable " style="" /></p> <p style="text-align: center"></p><p><span style="font-size: 12px">Website වල root directory එකේ තියෙන තවත් වැදගත් file එකක් තමයි robots.txt කියන text file එක. CMS එකක් භාවිතයෙන් web develop කරා නම් default මේ file එක තියෙනවා. නැතිනම් අපි manually මේක හදන්න ඕන.</span></p><p></p><p><span style="font-size: 12px">මේ file එකෙන් සාමාන්ය visitor කෙනෙක්ට ප්රයෝජනයක් නැති උනත් SEO වලදී ගොඩක් වැදගත් වෙනවා. Google, Yahoo, Bing වගේ search engine වලට තමන්ගේ search list එකට site එකේ access හදන්නේ මේ robots.txt file එකෙන්.</span></p><p></p><p><span style="font-size: 12px">Google වගේ search engine වලට <a href="https://web.archive.org/web/20160129234422/https://en.wikipedia.org/wiki/Web_crawler" target="_blank">web spiders/ web crawler</a> කියලා Internet bot තියෙනවා. ඉතින් මේ web spiders ල internet එක පුරාම ගිහින් එක එක වෙබ් අඩවි වල අන්තර්ගතය අනුව තමන්ගේ search results database වලට ඒ ඒ web sites add කර ගන්නවා. මෙයාල site එකකට ගිහින් මුලින්ම කරන දේ තමයි මේ robots.txt file එකක් තියෙනවද කියල සොයා බලන එක. තියෙනවා නම් එකේ තියෙන commands වලට අනුව allowed area තමන්ගේ database එකට add කර ගන්නවා. disallow කරලා තියෙන area වලට යන්නේ නැහැ.</span></p><p></p><p><span style="font-size: 12px">දැන් ඔබට හිතේවි search engine එකකට disallow කරන area තියෙනවද කියලා. ඔව් අනිවාර්යයෙන්ම. ඇයි admin login, member login area, logged users ලට පමණක් දෙන contents.</span></p><p></p><p><span style="font-size: 12px">අපි බලමු ප්රධාන පෙලේ web site කිහිපයක robots.txt files:</span></p><p><span style="font-size: 12px"></span></p><p><span style="font-size: 12px">Google : <a href="https://www.google.lk/robots.txt" target="_blank">https://www.google.lk/robots.txt </a></span></p><p><span style="font-size: 12px">Facebook : <a href="https://www.facebook.com/robots.txt" target="_blank">https://www.facebook.com/robots.txt</a></span></p><p><span style="font-size: 12px">Wikipedia : <a href="https://en.wikipedia.org/robots.txt" target="_blank">https://en.wikipedia.org/robots.txt</a></span></p><p><span style="font-size: 12px"></span></p><p><span style="font-size: 12px">Robots.txt ගැන යම් අවබෝධයක් ලැබෙන්න ඇති කියල හිතනවා. දැන් අපි බලමු මේ file එකේ commands ලියන්නේ කොහොමද කියලා. මේකෙ නිකන්ම text file එකක් එහෙමත් නැතිනම් notepad file එකක් පමණයි. ඉතින් notepad එක භාවිතයෙන් මේක ලියන්න පුළුවනි. සහ මේ file එක තියෙන්න ඕන root directory , cpanel file manager වල නම් domain public_html directory එකේ.</span></p><p></p><ul> <li data-xf-list-type="ul"><span style="font-size: 12px">සම්පුර්ණ වෙබ් අඩවියේ සියලුම content read access Web Crawler ට ලබා දෙන්නේ මෙහෙමයි.</span></li> </ul><p>[PHP]</p><p>User-agent: *</p><p>Allow: /</p><p>[/PHP]</p><p></p><ul> <li data-xf-list-type="ul"><span style="font-size: 12px">Web Crawler ට සම්පුර්ණ site එක disallow කරන්නේ මෙහෙමයි.</span></li> </ul><p>[PHP]</p><p>User-agent: *</p><p>Disallow: /</p><p>[/PHP]</p><p></p><p><span style="font-size: 12px">feedburner එහෙම disallow කරපු site එකකට උදාහරණයක්.</span></p><p><span style="font-size: 12px">Ex: <a href="https://feedburner.google.com/robots.txt" target="_blank">https://feedburner.google.com/robots.txt</a></span></p><p><span style="font-size: 12px"></span></p><p><span style="font-size: 12px">අපි ඒ site එක ගැන search කරාම search results ලැබෙන්නේ මෙහෙමයි.</span></p><p><span style="font-size: 12px"></span></p><p><span style="font-size: 12px"><img src="http://oi63.tinypic.com/2i04320.jpg" alt="" class="fr-fic fr-dii fr-draggable " style="" /></span></p><p><span style="font-size: 12px"></span></p><p><span style="font-size: 12px"></span></p><ul> <li data-xf-list-type="ul"><span style="font-size: 12px">අපි තෝරාගත් directory එකක් හෝ කිහිපයක් disallow කරන්නේ මෙහෙමයි.</span></li> </ul><p>[PHP]</p><p>User-agent: *</p><p>Disallow: /folder_1/</p><p>Disallow: /folder_2/</p><p>[/PHP]</p><p></p><ul> <li data-xf-list-type="ul"><span style="font-size: 12px">තෝරාගනිපු file එකක් හෝ කිහිපයක් disallow කරන්නේ මෙහෙමයි.</span></li> </ul><p>[PHP]</p><p>User-agent: *</p><p>Disallow: /sample_folder/test.php</p><p>[/PHP]</p><p></p><ul> <li data-xf-list-type="ul"><span style="font-size: 12px">අපි කැමති search engine bot කෙනෙක්ට පමණක් disallow කරන්නේ මෙහෙමයි. මම මෙතන Google Web Spider තෝරාගත්තා. දැනට භාවිතයේ ඉන්න active robots ල list එකක් මෙතන තියෙනවා. (<a href="http://www.robotstxt.org/db.html" target="_blank">http://www.robotstxt.org/db.html</a>)</span></li> </ul><p>[PHP]</p><p>User-agent: Googlebot</p><p>Disallow: /</p><p>[/PHP]</p><p></p><p>Copyright © මගේ පරණ බ්ලොග් එකෙන් <img src="/styles/default/xenforo/smilies/default/yes.gif" class="smilie" loading="lazy" alt=":yes:" title="Yes :yes:" data-shortname=":yes:" /> දැන් එකේ කෑලිත් නැහැ <img src="/styles/default/xenforo/smilies/default/rolleyes.gif" class="smilie" loading="lazy" alt=":rolleyes:" title="Rolleyes :rolleyes:" data-shortname=":rolleyes:" /></p><p></p><p><span style="color: Red">Rep බාරගනු ලැබේ..</span></p></blockquote><p></p>
[QUOTE="lahiruyasintha, post: 21635073, member: 312308"] [CENTER][IMG]http://www.nikhilchandra.in/wp-content/uploads/2013/07/how-to-use-robots-txt.png[/IMG] [/CENTER] [SIZE="3"]Website වල root directory එකේ තියෙන තවත් වැදගත් file එකක් තමයි robots.txt කියන text file එක. CMS එකක් භාවිතයෙන් web develop කරා නම් default මේ file එක තියෙනවා. නැතිනම් අපි manually මේක හදන්න ඕන.[/SIZE] [SIZE="3"]මේ file එකෙන් සාමාන්ය visitor කෙනෙක්ට ප්රයෝජනයක් නැති උනත් SEO වලදී ගොඩක් වැදගත් වෙනවා. Google, Yahoo, Bing වගේ search engine වලට තමන්ගේ search list එකට site එකේ access හදන්නේ මේ robots.txt file එකෙන්.[/SIZE] [SIZE="3"]Google වගේ search engine වලට [URL="https://web.archive.org/web/20160129234422/https://en.wikipedia.org/wiki/Web_crawler"]web spiders/ web crawler[/URL] කියලා Internet bot තියෙනවා. ඉතින් මේ web spiders ල internet එක පුරාම ගිහින් එක එක වෙබ් අඩවි වල අන්තර්ගතය අනුව තමන්ගේ search results database වලට ඒ ඒ web sites add කර ගන්නවා. මෙයාල site එකකට ගිහින් මුලින්ම කරන දේ තමයි මේ robots.txt file එකක් තියෙනවද කියල සොයා බලන එක. තියෙනවා නම් එකේ තියෙන commands වලට අනුව allowed area තමන්ගේ database එකට add කර ගන්නවා. disallow කරලා තියෙන area වලට යන්නේ නැහැ.[/SIZE] [SIZE="3"]දැන් ඔබට හිතේවි search engine එකකට disallow කරන area තියෙනවද කියලා. ඔව් අනිවාර්යයෙන්ම. ඇයි admin login, member login area, logged users ලට පමණක් දෙන contents.[/SIZE] [SIZE="3"]අපි බලමු ප්රධාන පෙලේ web site කිහිපයක robots.txt files: Google : [URL="https://www.google.lk/robots.txt"]https://www.google.lk/robots.txt [/URL] Facebook : [URL="https://www.facebook.com/robots.txt"]https://www.facebook.com/robots.txt[/URL] Wikipedia : [URL="https://en.wikipedia.org/robots.txt"]https://en.wikipedia.org/robots.txt[/URL] Robots.txt ගැන යම් අවබෝධයක් ලැබෙන්න ඇති කියල හිතනවා. දැන් අපි බලමු මේ file එකේ commands ලියන්නේ කොහොමද කියලා. මේකෙ නිකන්ම text file එකක් එහෙමත් නැතිනම් notepad file එකක් පමණයි. ඉතින් notepad එක භාවිතයෙන් මේක ලියන්න පුළුවනි. සහ මේ file එක තියෙන්න ඕන root directory , cpanel file manager වල නම් domain public_html directory එකේ.[/SIZE] [LIST] [*][SIZE="3"]සම්පුර්ණ වෙබ් අඩවියේ සියලුම content read access Web Crawler ට ලබා දෙන්නේ මෙහෙමයි.[/SIZE] [/LIST] [PHP] User-agent: * Allow: / [/PHP] [LIST] [*][SIZE="3"]Web Crawler ට සම්පුර්ණ site එක disallow කරන්නේ මෙහෙමයි.[/SIZE] [/LIST] [PHP] User-agent: * Disallow: / [/PHP] [SIZE="3"]feedburner එහෙම disallow කරපු site එකකට උදාහරණයක්. Ex: [URL="https://feedburner.google.com/robots.txt"]https://feedburner.google.com/robots.txt[/URL] අපි ඒ site එක ගැන search කරාම search results ලැබෙන්නේ මෙහෙමයි. [IMG]http://oi63.tinypic.com/2i04320.jpg[/IMG] [/SIZE] [LIST] [*][SIZE="3"]අපි තෝරාගත් directory එකක් හෝ කිහිපයක් disallow කරන්නේ මෙහෙමයි.[/SIZE] [/LIST] [PHP] User-agent: * Disallow: /folder_1/ Disallow: /folder_2/ [/PHP] [LIST] [*][SIZE="3"]තෝරාගනිපු file එකක් හෝ කිහිපයක් disallow කරන්නේ මෙහෙමයි.[/SIZE] [/LIST] [PHP] User-agent: * Disallow: /sample_folder/test.php [/PHP] [LIST] [*][SIZE="3"]අපි කැමති search engine bot කෙනෙක්ට පමණක් disallow කරන්නේ මෙහෙමයි. මම මෙතන Google Web Spider තෝරාගත්තා. දැනට භාවිතයේ ඉන්න active robots ල list එකක් මෙතන තියෙනවා. ([URL="http://www.robotstxt.org/db.html"]http://www.robotstxt.org/db.html[/URL])[/SIZE] [/LIST] [PHP] User-agent: Googlebot Disallow: / [/PHP] Copyright © මගේ පරණ බ්ලොග් එකෙන් :yes: දැන් එකේ කෑලිත් නැහැ :rolleyes: [COLOR="Red"]Rep බාරගනු ලැබේ..[/COLOR] [/QUOTE]
Insert quotes…
Verification
Hathara warak wissa keeyada? (Hathara wadi karanna 20)
Post reply
Top
Bottom