আসুন আজ জানব ইন্টারনেট জগতের লুকিয়ে (hidden websites) থাকা কিছু ওয়েবসাইটের কথা:-
Hidden websites : গবেষকদের মতে ইন্টারনেটে যতগুলি সার্চ ইঞ্জিন আছে তাতে কমপক্ষে 4.5 বিলিয়ান ওয়েবসাইট রয়েছে। কিন্তু আসল মজার ব্যাপার হচ্ছে এটা এই ওয়েবসাইটের ভান্ডারে ছাড়াও এর থেকে 400-500 গুণ বড় একটা ইন্টারনেট অংশ লুকিয়ে(hidden websites) আছে যাকে বলা হয় Dark Web ও Deep Web ।
হলিউডি ছবির ওই দৃশ্যের কথা মনে আছে যেখানে গডফাদার তার পোষা খুনীর সাথে কখনো মখোমুখি সাক্ষাত না করে এক অতি গোপন নেটওয়ার্কের মধ্য দিয়ে হুকুম দিয়ে যান, অথবা কি মনেপড়ে আঞ্জেলিনা জুলি অভিনীত ‘Hacker’ ছবিটির কথা যেখানে অপরাধীরা এক নাম না জানা নেটওয়ার্কের ভেতর নানা অপরাধ করত—যেখানে আইন শৃঙ্খলা বাহিনী নাক গলাতে পারত না?
তথ্যপ্রযুক্তির উৎকর্ষের সাথে সাথে প্রসার পেয়েছে ইন্টারনেট, আর তা আজ মহাসমুদ্রের ন্যায় বিশাল এক ক্ষেত্রে পরিণত হয়েছে। এর সাথে তাল মিলিয়ে সক্ষমতা বেড়েছে সার্চ ইঞ্জিনগুলোর। বিশেষ করে Google এর নাম বলতেই হবে, যা এখন বিশ্বব্যাপী অন্যতম এক বিশ্বস্ত ব্র্যান্ডে পরিণিত হয়েছে।
আজআমরাআলোচনাকরবDeep Webডিপওয়েবনিয়ে:-
Deep Web :– ডীপ ওয়েব হল ইন্টারনেটের ওই সমস্ত অংশ যেগুলো সার্চ ইঞ্জিন খুঁজে পায় না কিন্তু আপনি যদি এগুলোর ঠিকানা জানেন তাহলে আপনি এই অংশে যেতে পারবেন। ইন্টারনেটের এই অংশের উৎপত্তি কিভাবে হল? একদম সঠিক করে বলা অসম্ভব। প্রকৃতপক্ষে আপনি বা আমি কেউই ইন্টারনেটে একা নই! আপনার প্রতিটি পদক্ষেপ, প্রতিটি ডাউনলোড নজরে রাখছে আপনার ইন্টারনেট সার্ভিস প্রভাইডার।
তাদের কাছে আপনার পুরো লগ থাকে আর যেকোন প্রয়োজনে তারা তা সরবরাহ করে আইনশৃঙ্খলা বাহিনীর কাছে। তার মানে হল আপনার চলাচলের কোন স্বাধীনতা নেই!!! নানা সময়ে বিশ্ব ইন্টারনেটের নানা গ্রুপ এমন একটি ব্যবস্থার প্রয়োজনীয়তা অনুভব করেছে যেখানে তারা খুব গোপনে তাদের কর্মকান্ড পরিচালনা করতে পারবে।
সামরিকবাহিনী, বিপ্লবী, হ্যাকার, এমনকিই খোদ প্রশাসনই এমন এক ব্যবস্থা চেয়েছে যেখানে গোয়েন্দারা খুব গোপনে নিজেদের ভেতর তথ্য আদান প্রদান করতে পারবে অথবা চুরি যাওয়া তথ্য ফিরে পেতে দর কষাকষি করতে পারবেন অপরাধীদের সাথে।
তাছাড়া বিশ্বের অনেকদেশ আছে যেখানকার অনলাইন সেন্সরশিপ খুবই কড়া, ফলাফলস্বরুপ ভিন্নমতালম্বিদের এমন এক ব্যবস্থার কথা চিন্তা করতে হয়েছে যেখানে সরকার তদারকি করতে পারবে না। আর এভাবেই উৎপত্তি হয়েছে এই অজানা অংশের। সাথে সাথে এটা প্রলুব্ধ করেছে ওই সমস্ত অপরাধীদের যারা ধরা পড়ে যাওয়ার ভয়ে মূল নেটে আলোচনা করতে সাহস পায় না।
এর কারণ হল সার্চ ইঞ্জিনগুলো তাদের সার্চ তদারকি করে এক ধরনের ভার্চুয়াল রোবট তথা Crawler দিয়ে। এই Crawler গুলো ওয়েবসাইটের HTML tag দেখে ওয়েবসাইটগুলোকে লিপিবদ্ধ করে।তাছাড়া কিছু কিছু সাইট থেকেসার্চ ইঞ্জিনে লিপিবদ্ধ হওয়ার জন্য রিকোয়েস্ট যায়। এখন যে সমস্ত সাইট এডমিন চান না যে তাদের সাইটটি সার্চ ইঞ্জিন খুঁজে না পাক, তারা Robot Exclusion Protocol ব্যবহার করেন যা Crawler গুলোকে সাইটগুলো খুঁজে পাওয়া বা লিপিবদ্ধ করা থেকে বিরত রাখে।
কিছু সাইট আছে ডাইনামিক অর্থাৎ নির্দিষ্ট কিছু শর্ত পূরণ সাপেক্ষে এই ধরণের সাইটের অস্তিত্ব খুঁজে পাওয়া সম্ভব, আর Crawler এর পক্ষে এই সব করা সম্ভব হয় না। কিছু সাইট আছে যেগুলোতে অন্য সাইট থেকে লিংক নেই। এগুলো বিচ্ছিন্ন সাইট, এগুলোও সার্চে আসে না। তাছাড়া বলতে গেলে সার্চ ইঞ্জিন টেকনোলজি এখনো তার আঁতুড় ঘর ছাড়তে পারে নি।
সার্চ ইঞ্জিনগুলো Text বাদে অন্য ফরম্যাটে থাকা(যেমন ফ্ল্যাশ ফরম্যাট) ওয়েবপ্যাজ খুঁজে পায় না! এই ডীপ ওয়েবে থাকা তথ্যগুলো সারফেস ওয়েবের তথ্য থেকে মানে গুনে এগিয়ে। এগুলো খুবই সুসজ্জিত এবং প্রাসঙ্গিক। তাহলে বুঝুন সার্চ ইঞ্জিনগুলো কি করছে!!!
আমাদের লেখা আপনার কেমন লাগছে ও আপনার যদি কোন প্রশ্ন থাকে তবে নিচে কমেন্ট করে জানান ।