আসুন আজ জানব ইন্টারনেট জগতের লুকিয়ে (hidden websites) থাকা কিছু ওয়েবসাইটের কথা:-
Hidden websites : গবেষকদের মতে ইন্টারনেটে যতগুলি সার্চ ইঞ্জিন আছে তাতে কমপক্ষে 4.5 বিলিয়ান ওয়েবসাইট রয়েছে। কিন্তু আসল মজার ব্যাপার হচ্ছে এটা এই ওয়েবসাইটের ভান্ডারে ছাড়াও এর থেকে 400-500 গুণ বড় একটা ইন্টারনেট অংশ লুকিয়ে(hidden websites) আছে যাকে বলা হয় Dark Web ও Deep Web ।
হলিউডি ছবির ওই দৃশ্যের কথা মনে আছে যেখানে গডফাদার তার পোষা খুনীর সাথে কখনো মখোমুখি সাক্ষাত না করে এক অতি গোপন নেটওয়ার্কের মধ্য দিয়ে হুকুম দিয়ে যান, অথবা কি মনে পড়ে আঞ্জেলিনা জুলি অভিনীত ‘Hacker’ ছবিটির কথা যেখানে অপরাধীরা এক নাম না জানা নেটওয়ার্কের ভেতর নানা অপরাধ করত—যেখানে আইন শৃঙ্খলা বাহিনী নাক গলাতে পারত না?
তথ্যপ্রযুক্তির উৎকর্ষের সাথে সাথে প্রসার পেয়েছে ইন্টারনেট, আর তা আজ মহাসমুদ্রের ন্যায় বিশাল এক ক্ষেত্রে পরিণত হয়েছে। এর সাথে তাল মিলিয়ে সক্ষমতা বেড়েছে সার্চ ইঞ্জিনগুলোর। বিশেষ করে Google এর নাম বলতেই হবে, যা এখন বিশ্বব্যাপী অন্যতম এক বিশ্বস্ত ব্র্যান্ডে পরিণিত হয়েছে।
আজ আমরা আলোচনা করব Deep Web ডিপ ওয়েব নিয়ে:-
Deep Web :– ডীপ ওয়েব হল ইন্টারনেটের ওই সমস্ত অংশ যেগুলো সার্চ ইঞ্জিন খুঁজে পায় না কিন্তু আপনি যদি এগুলোর ঠিকানা জানেন তাহলে আপনি এই অংশে যেতে পারবেন। ইন্টারনেটের এই অংশের উৎপত্তি কিভাবে হল? একদম সঠিক করে বলা অসম্ভব। প্রকৃতপক্ষে আপনি বা আমি কেউই ইন্টারনেটে একা নই! আপনার প্রতিটি পদক্ষেপ, প্রতিটি ডাউনলোড নজরে রাখছে আপনার ইন্টারনেট সার্ভিস প্রভাইডার।
তাদের কাছে আপনার পুরো লগ থাকে আর যেকোন প্রয়োজনে তারা তা সরবরাহ করে আইনশৃঙ্খলা বাহিনীর কাছে। তার মানে হল আপনার চলাচলের কোন স্বাধীনতা নেই!!! নানা সময়ে বিশ্ব ইন্টারনেটের নানা গ্রুপ এমন একটি ব্যবস্থার প্রয়োজনীয়তা অনুভব করেছে যেখানে তারা খুব গোপনে তাদের কর্মকান্ড পরিচালনা করতে পারবে।
সামরিকবাহিনী, বিপ্লবী, হ্যাকার, এমনকিই খোদ প্রশাসনই এমন এক ব্যবস্থা চেয়েছে যেখানে গোয়েন্দারা খুব গোপনে নিজেদের ভেতর তথ্য আদান প্রদান করতে পারবে অথবা চুরি যাওয়া তথ্য ফিরে পেতে দর কষাকষি করতে পারবেন অপরাধীদের সাথে।
তাছাড়া বিশ্বের অনেকদেশ আছে যেখানকার অনলাইন সেন্সরশিপ খুবই কড়া, ফলাফলস্বরুপ ভিন্নমতালম্বিদের এমন এক ব্যবস্থার কথা চিন্তা করতে হয়েছে যেখানে সরকার তদারকি করতে পারবে না। আর এভাবেই উৎপত্তি হয়েছে এই অজানা অংশের। সাথে সাথে এটা প্রলুব্ধ করেছে ওই সমস্ত অপরাধীদের যারা ধরা পড়ে যাওয়ার ভয়ে মূল নেটে আলোচনা করতে সাহস পায় না।
এখন প্রশ্ন হল ডীপ ওয়েবে কেন সার্চ ইঞ্জিন সার্চ করতে পারে না?
এর কারণ হল সার্চ ইঞ্জিনগুলো তাদের সার্চ তদারকি করে এক ধরনের ভার্চুয়াল রোবট তথা Crawler দিয়ে। এই Crawler গুলো ওয়েবসাইটের HTML tag দেখে ওয়েবসাইটগুলোকে লিপিবদ্ধ করে।তাছাড়া কিছু কিছু সাইট থেকে সার্চ ইঞ্জিনে লিপিবদ্ধ হওয়ার জন্য রিকোয়েস্ট যায়। এখন যে সমস্ত সাইট এডমিন চান না যে তাদের সাইটটি সার্চ ইঞ্জিন খুঁজে না পাক, তারা Robot Exclusion Protocol ব্যবহার করেন যা Crawler গুলোকে সাইটগুলো খুঁজে পাওয়া বা লিপিবদ্ধ করা থেকে বিরত রাখে।
কিছু সাইট আছে ডাইনামিক অর্থাৎ নির্দিষ্ট কিছু শর্ত পূরণ সাপেক্ষে এই ধরণের সাইটের অস্তিত্ব খুঁজে পাওয়া সম্ভব, আর Crawler এর পক্ষে এই সব করা সম্ভব হয় না। কিছু সাইট আছে যেগুলোতে অন্য সাইট থেকে লিংক নেই। এগুলো বিচ্ছিন্ন সাইট, এগুলোও সার্চে আসে না। তাছাড়া বলতে গেলে সার্চ ইঞ্জিন টেকনোলজি এখনো তার আঁতুড় ঘর ছাড়তে পারে নি।
সার্চ ইঞ্জিনগুলো Text বাদে অন্য ফরম্যাটে থাকা(যেমন ফ্ল্যাশ ফরম্যাট) ওয়েবপ্যাজ খুঁজে পায় না!
এই ডীপ ওয়েবে থাকা তথ্যগুলো সারফেস ওয়েবের তথ্য থেকে মানে গুনে এগিয়ে। এগুলো খুবই সুসজ্জিত এবং প্রাসঙ্গিক। তাহলে বুঝুন সার্চ ইঞ্জিনগুলো কি করছে!!!
আমাদের লেখা আপনার কেমন লাগছে ও আপনার যদি কোন প্রশ্ন থাকে তবে নিচে কমেন্ট করে জানান ।