23

লোকে বলে এলএসআই কীওয়ার্ড দিয়ে গুগল র‍্যাংকিং তুঙ্গে তোলা যায়। এটা কি সত্যি, না স্রেফ আরেকটি এসইও সংক্রান্ত গুজন?

এলএসআই কীওয়ার্ড নিয়ে যে লেখাই পড়ুন, সবখানে আপনাকে দুটো কথা বলা হবে:

  1. ওয়েব পেইজ ইনডেক্স করতে গুগল এলএসআই নামক একটি প্রযুক্তি ব্যবহার করে.
  2. আপনার কন্টেন্টে এলএসআই কীওয়ার্ড ব্যবহার করলে গুগলে আপনার র‍্যাংক বেড়ে যাবে।

তাত্ত্বিকভাবে দুটো দাবিই মিথ্যে।

এই নির্দেশিকায় আপনি এর আগা-পাশ-তলা জানতে পারবেন। তবে তার আগে একদম গোড়া থেকে শুরু করা যাক …

এলএসআই কীওয়ার্ডস আসলে কী?

এলএসআই কীওয়ার্ড হলো এমন কিছু শব্দ ও বাক্যাংশ, যেগুলোকে কোনো নির্দিষ্ট বিষয়বস্তুর সাথে অর্থগতভাবে সম্পর্কিত হিসেবে দেখে গুগল—অন্তত এসইও গোষ্ঠীর অনেকের মতে এমনটিই। আর গাড়ির কথা বললে এলএসআই কীওয়ার্ডস হলো অটোমোবাইল, এঞ্জিন, রাস্তা, টায়ার, যানবাহন এবং স্বয়ংক্রিয় পরিবহন।

কিন্তু গুগলে জন মুলারের মতে, এলএসআই কীওয়ার্ড বলে আদৌ কিছু নেই:

John

✔@JohnMu

Replying to @klaudiofejzaj

এলএসআই কীওয়ার্ড বলে কিছু নেই – যে আপনাকে এসব বলেছে, সে ভুল করেছে। দুঃখিত।

125

2:01 AM – Jul 31, 2019

Twitter Ads info and privacy

68 people are talking about this

 

web writers

 

তো ব্যাপারটা কী আসলে?

সেটা জানার আগে খোদ এলএসআই সম্পর্কে আরেকটু জেনে নেওয়া যাক।

ল্যাটেন্ট সেম্যান্টিক ইনডেক্সিং কী?

ল্যাটেন্ট সেম্যান্টিক ইনডেক্সিং (এলএসআই) বা ল্যাটেন্ট সেম্যান্টিক অ্যানালিসিস (এলএসএ) হলো ১৯৮০ সালে উদ্ভাবিত একটি স্বাভাবিক-ভাষা প্রক্রিয়াকরণ পদ্ধতি।

দুর্ভাগ্যবশত, eigenvaluesvectors, এবং single value decomposition এর মতো গাণিতিক শব্দের সাথে পরিচিতি না থাকলে এই প্রযুক্তি বুঝে ওঠা সহজ না।

তাই এলএসআই কীভাবে কাজ করে, সে আলোচনায় আমরা যাচ্ছি না।

বরং কোন সমস্যার সমাধান করতে এটি তৈরি হয়েছিল, তা দেখা যাক।

এলএসআই’র নির্মাতারা সমস্যাটিকে কীভাবে সংজ্ঞায়িত করেন, দেখুন:

অনুসন্ধানকারী যে শব্দ ব্যবহার করে জিনিসটি খোঁজেন, ঠিক সেই শব্দ দিয়ে হয়তো ওই জিনিসটি তালিকাভুক্ত করা হয়নি।

মানে?

মনে করুন আপনি fall শরতকাল সম্পর্কে জানতে চান। আপনার ওয়াইফাই কাজ করছে না। তাই আদিকেলে নিয়ম অনুসরণ করে বের করলেন একটি এনসাইক্লোপিডিয়া। এলোপাতাড়ি হাজার হাজার পৃষ্ঠা না খুঁজে আপনি সূচিপত্রে “fall” শব্দটা দেখে সেই পৃষ্ঠায় চলে গেলেন।

গিয়ে দেখলেন এটা:

কিন্তু আপনি তো এই fall সম্পর্কে জানতে চাননি।

এবার বুঝলেন বিষয়টি খুঁজতে হবে “autumn” শব্দ দিয়ে, শরতের আরেকটি ইংরেজি নাম।

সমস্যাটা হয়েছিল যে, fall শব্দের অনেক অর্থ আছে।

সমার্থক শব্দ কী?

সমার্থক শব্দ হলো একই বা প্রায় একই অর্থজ্ঞাপক একাধিক শব্দ বা বাক্যাংশ।

যেমন rich এবং wealthyfall এবং autumncars এবং automobiles.

এলএসআই প্যাটেন্ট অনুযায়ী সমার্থক শব্দের সমস্যা হলো এই:

[…] একই বস্তু বা বিষয় বোঝাতে মানুষ যেসব শব্দ ব্যবহার করে, সেগুলো মারাত্মক বৈচিত্র্যপূর্ণ। একে বলে সমার্থকতা। বিভিন্ন প্রসঙ্গে, বিভিন্ন প্রয়োজনে, জ্ঞান ও ভাষিক

পার্থক্যের ফলে একই তথ্য ভিন্ন ভিন্ন শব্দে প্রকাশিত হয়। যেমন, গবেষণায় দেখা গেছে দুজন মানুষ একই এবং সুপরিচিত একটি জিনিস বোঝাতে একই শব্দ ব্যবহার করে গড়ে ২০ শতাংশেরও কম ক্ষেত্রে।

কিন্তু সার্চ এঞ্জিনের সাথে এর সম্পর্ক কী?

ধরুন গাড়ি সম্পর্কে আমাদের দুটো ওয়েবপেজ আছে। দুটোই একই জিনিস, খালি একটাতে সবখানে cars এর বদলে লিখা automobiles.

সেকেলে সার্চ এঞ্জিনগুলো ওই পেজে ব্যবহৃত শব্দগুলোই ইনডেক্স করে রাখে। তাই সব ফলাফল ঘুরেফিরে “cars.” শব্দগুলোই দেখাবে।

অথচ অন্য ফলাফলগুলোও কিন্তু প্রাসঙ্গিক ছিল, স্রেফ শব্দ ভিন্ন। এমনকি automobile দিয়ে উল্লেখ করা তথ্যগুলো cars শব্দে উল্লেখিত ফলাফলগুলোর চেয়ে বেশি দরকারিও হতে পারত।

মোট কথা: ভালো ফলাফল দেওয়ার জন্য সার্চ এঞ্জিনগুলোর সমার্থক শব্দ বুঝতে পারে জরুরি।

skyscapper-link-building

বহু অর্থবোধক শব্দ কী?

বহু অর্থবোধক শব্দ হলো একাধিক অর্থধারী শব্দ বা বাক্যাংশ।

যেমন mouse (প্রাণী/কম্পিউটারের অংশ), bank (আর্থিক প্রতিষ্ঠান/ সমুদ্রসৈকত), এবং bright (উজ্জ্বল/বুদ্ধিমান)।

এলএসআই নির্মাতাদের মতে এই শব্দগুলোর সমস্যা এই:

ভিন্ন প্রসঙ্গে ভিন্ন ভিন্ন ব্যক্তি একই শব্দ দিয়ে ভিন্ন ভিন্ন জিনিস বোঝাতে পারেন। তাই একই শব্দ দিয়ে সার্চ করার অর্থ এই না যে, সবাই একই জিনিস খুঁজছে।

এখানেও তাই সমার্থক শব্দের মতো সমস্যা দেখা দেয় সার্চ এঞ্জিনে।

যেমন “apple computer” সার্চ করলে সেকেলে সার্চ এঞ্জিনগুলো এসব অপ্রাসঙ্গিক পেজ দেখাতে পারে:

মোটকথা: যেসব সার্চ এঞ্জিন বহু অর্থবোধক শব্দ বোঝে না, সেগুলো অপ্রাসঙ্গিক ফলাফল দেখাবে।

এলএসআই কীভাবে কাজ করে?

কম্পিউটার হলো বোকা বাক্স।

মানুষ যেভাবে শব্দ ও অর্থের সম্পর্ক বোঝে, তারা তা বোঝে না।

যেমন সবাই জানে big আর large একই জিনিস। আরো জানে John Lennon ছিলেন The Beatles ব্যান্ডে।

কিন্তু কম্পিউটারকে সেটা বলে না দিলে সে তা জানবে না।

সমস্যা হলো কম্পিউটারকে সবকিছু আলাদা আলাদা করে বলার উপায় নেই। এ বড় সময় ও শ্রমসাধ্য।

এলএসআই কিছু জটিল গাণিতিক ফর্মুলা ব্যবহার করে এক সেট ডকুমেন্ট থেকে অসংখ্য শব্দ-শব্দাংশের মাঝে সম্পর্ক নির্ণয় করে।

সহজ ভাষায়, ঋতু সংক্রান্ত এক সেট ডকুমেন্টে এলএসএ চালালে কম্পিউটার হয়তোবা কিছু বিষয় বুঝে নেবে:

প্রথমত fall ও autumn সমার্থক:

দ্বিতীয়ত, seasonsummerwinterfall, এবং spring শব্দগুলো অর্থগতভাবে পরস্পর সম্পর্কিত:

তৃতীয়ত, fall শব্দটি অর্থগতভাবে দুটি ভিন্ন শব্দগোষ্ঠীর সাথে সম্পর্কিত:

সার্চ এঞ্জিন তখন নেহাত শব্দ মেলানোর গণ্ডি ছাড়িয়ে প্রাসঙ্গিকতর ফলাফল দেখাতে সক্ষম হয়ে ওঠে।

গুগল কি এলএসআই ব্যবহার করে?

এলএসআই যেসব সমস্যা সমাধান করে, তা থেকেই বোঝা যায় মানুষ কেন গুগলকে এলএসআই প্রযুক্তি ব্যবহারকারী ভেবে বসে।

আর গুগল যে সমার্থকতা বোঝে, তা তো আমরা চোখের সামনেই দেখতে পাই:

বহু অর্থবাচকতাও বোঝে:

কিন্তু তারপরো, গুগল মোটেই এলএসআই প্রযুক্তি ব্যবহার করে না

কীভাবে জানলাম? গুগলের প্রতিনিধিরা বলেছেন।

তাদের কথা বিশ্বাস হয় না?

আরো তিনটে প্রমাণ দেখুন তবে:

. LSI সেকেলে প্রযুক্তি

LSI আবিষ্কৃত হয় আশির দশকে, ওয়ার্ল্ড ওয়াইড ওয়েবের জন্মের আগে। এত বিশাল ডকুমেন্ট সেটে ব্যবহারের উদ্দেশ্য কখনওই এর ছিল না।

গুগল তাই একই সমস্যা সমাধানে উন্নততর প্রযুক্তি ব্যবহার করে আসছে।

বিল স্লাওস্কি বলেন:

LSI প্রযুক্তি ওয়েবের মতো বিশাল জিনিসে ব্যবহৃত হওয়ার জন্য তৈরি হয়নি […] Google একটি word vector approach ডেভেলাপ করেছে (Rankbrain-এ ব্যবহৃত হয়) যা আধুনিকতর, উন্নততর, এবং ওয়েব উপযোগী। Word2vec থাকতে এলএসআই ব্যবহার করা মানে Ferrariর সাথে ঠেলাগাড়ি নিয়ে প্রতিযোগিতা করা।

. LSI তৈরি হয়েছিল জ্ঞাত ডকুমেন্ট ইনডেক্স করার জন্য

World Wide Web শুধু বড়ই না, গতিশীলও।

অর্থাৎ, গুগলের ইনডেকএক্সে কোটি কোটি পেইজ নিয়মিত পরিবর্তিত হয়।

অথচ এলএসআই প্যাটেন্টে বলা আছে যে, যতবার স্টোরেজ ফাইলে গুরুত্বপূর্ণ কোনো আপডেট হবে, ততবারই নতুন করে বিশ্লেষণ চালাতে হবে।

এতে প্রচুর প্রসেসিং পাওয়ার লাগবে।

. LSI প্যাটেন্ট করা প্রযুক্তি

বেল কমিউনিকেশান্স রিসার্চ ইনক-কে ১৯৮৯ সালে Latent Semantic Indexing (LSI) patent প্রদান করা হয়। প্রযুক্তিটির এক সহ-উদ্ভাবক সুসান ডুমাইস পরে ১৯৯৭ সালে মাইক্রোসফটে যোগ দেন। তিনি সেখানে সার্চ সংক্রান্ত আবিষ্কারের ওপর কাজ করেন।

আর ইউএস প্যাটেন্ট কিন্তু ২০ বছর পর মেয়াদোত্তীর্ণ হয়ে যায়। অর্থাৎ, ২০০৮ সালে এলএসআইয়ের প্যাটেন্ট মেয়াদ শেষ হয়ে গেছে।

২০০৮ সালের বেশ আগে থেকেই গুগল ভাষা বোঝা এবং প্রাসঙ্গিক ফলাফল দেখানোর কাজটা খুব ভালোভাবে করে আসছে। এটি আরেকটি প্রমাণ যে, গুগল এলএসআই ব্যবহার করে না।

বিল স্লাওস্কির আরেকটি উদ্ধৃতি:

গুগল সমার্থক ও বহু অর্থবোধক শব্দের ইনডেক্স করার চেষ্টা করে বটে।  কিন্তু এ কাজে এলএসআই প্রযুক্তি ব্যবহার করে না। একে এলএসআই বলাতে মানুষ বিভ্রান্ত হচ্ছে। গুগল সেই ২০০৩ সাল থেকে সমার্থক শব্দভিত্তিক নিখুঁত ফলাফল দেওয়ার কাজ করে আসছে। তবে এর অর্থ এই না যে, এলএসআই ব্যবহার করে তা করা হয়। এমনটা বলার অর্থ মোবাইল ওয়েবে সংযোগ করার জন্য স্মার্ট টেলিগ্রাফ ডিভাইস ব্যবহার করা।

প্রাসঙ্গিক শব্দ, বাক্যাংশ এবং বিষয় উল্লেখ করলে কি র‍্যাংকিং বাড়ে?

বেশিরভাগ এসইও “LSI keywords”-কে প্রাসঙ্গিক শব্দ, বাক্যাংশ বা বিষয়ের তালিকার চেয়ে বেশি কিছু হিসেবে দেখে না।

তাত্ত্বিকভাবে ভুল হলেও সংজ্ঞাটা মেনে নিলে বলতে হয়, হ্যাঁ। কিছু প্রাসঙ্গিক শব্দের ব্যবহার আপনার কন্টেন্টের SEO বাড়াতে একটু তো কাজে লাগবেই।

কীভাবে জানলাম? গুগল আমাদের একটু ঘুরিয়ে বলেছে:

একটু ভাবুন: ‘dogs’ লিখে সার্চ করলে একশবার ‘dogs’ লিখা একটি পেইজ হয়তো সামনে আসবে। তা মাথায় রেখেই, অ্যালগোরিদম খুঁজে দেখে ‘dogs’ কীওয়ার্ডের বাইরে অন্য কোনো প্রাসঙ্গিক শব্দ আছে কি না – যেমন কুকুরের ছবি, ভিডিও বা এমনকি প্রজাতির তালিকাও

কুকুর সংক্রান্ত একটি পেইজে কুকুরের বিভিন্ন জাতের নামকে গুগল অর্থগতভাবে সম্পর্কিত শব্দ হিসেবে দেখে।

But why do these help pages to rank for relevant terms? (বুঝিনাই)

সহজ কথা: কারণ এর ফলে গুগল সেই পেইজের সার্বিক বিষয়বস্তু বুঝতে পারে।

যেমন, “dogs” শব্দটি একই সংখ্যকবার ব্যবহার করা দুটো পেইজ:

প্রতিটি পেইজের অন্যান্য গুরুত্বপূর্ণ শব্দ ও বাক্যাংশ দেখে বোঝা যায় যে, কেবল প্রথমটিই কুকুরের ব্যাপারে। দ্বিতীয়টি মূলত বিড়াল সংক্রান্ত।

গুগপ্ল এই তথ্য ব্যবহার করে প্রাসঙ্গিক পেইজ ও অনুসন্ধানের র‍্যাংকিং করে।

প্রাসঙ্গিক শব্দ কীভাবে খুঁজে বের করবেন

কোনো বিষয়ে জানাশোনা থাকলে আপনি স্বভাবতই সে সংক্রান্ত শব্দগুলো জানবেন।

যেমন, “PS4 games,” “Call of Duty,” বা “Fallout” শব্দগুলো না লিখে সেরা ভিডিও গেইমসের ওপর কোনো প্রবন্ধ লেখা সম্ভব না।

কিন্তু গুরুত্বপূর্ণ জিনিস মিস করে যাওয়াও স্বাভাবিক—বিশেষত জটিলতর বিষয়ে।

যেমন, sponsored and UGC link attributes এর ব্যাপারে আমাদের guide to nofollow links কিছু উল্লেখ করতে ব্যর্থ হয়:

গুগল হয়তো এগুলোকে গুরুত্বপূর্ণ ও অর্থগতভাবে সম্পর্কিত শব্দ হিসেবে দেখে, যেগুলো এ সংক্রান্ত ভালো প্রবন্ধে অবশ্যই থাকা দরকার।

এগুলো নিয়ে আলোচনা করা প্রবন্ধগুলো কেন র‍্যাংকিংয়ে আমাদের ছাড়িয়ে যায়, তার একটা কারণ হয়তো এটাও।

এ কথা মাথায় রেখেই চলুন প্রাসঙ্গিক শব্দ খোঁজার ৯টি উপায় দেখি:

. কাণ্ডজ্ঞান খাটান

সহজ কোনো বিষয় এড়িয়ে গেছেন কি না, দেখুন।

যেমন, ডোনাল্ড ট্রাম্পের জীবনী সংক্রান্ত কোনো প্রবন্ধে তার ইম্পিচমেন্টের বিষয়টি বাদ পড়লে যোগ করে নিন।

ফলে এ সম্পর্কিত শব্দ, বাক্যাংশ ও বিষয়গুলো এমনিই চলে আসবে। যেমন “Mueller Report,” “Nancy Pelosi,” এবং “whistleblower.”

জ্ঞাতব্য

গুগল এই শব্দগুলো অর্থগতভাবে সম্পর্কিত হিসেবে দেখে কি না, তা নিশ্চিত করে জানার কোনো উপায় নেই। তবে মানুষ যেসব শব্দ ও অর্থের মাঝে সম্পর্ক এমনিই বোঝে, গুগল সেগুলো বোঝার চেষ্টা করে। তাই এক দিক দিয়ে মিলও আছে।

. Autocomplete Results দেখুন

Autocomplete results সবসময় গুরুত্বপূর্ণ প্রাসঙ্গিক কীওয়ার্ডস দেখায় বা। তবে গুরুত্বপূর্ণ কিছু সূত্র ধরিয়ে দিতে পারে।

যেমন, “donald trump” লিখে সার্চ করলে autocomplete results  হিসেবে “donald trump spouse,” “donald trump age,” এবং “donald trump twitter” দেখা যায়।

এগুলো সরাসরি প্রাসঙ্গিক না হলেও কিছুটা সম্পর্কিত তো বটেই। এই ক্ষেত্রে সেগুলো হলো Melania Trump73 years old, এবং @realDonaldTrump.

জীবনীমূলক প্রবন্ধে যা যা দরকার, সেই সবগুলোই, তাই না?

. Related Searches দেখুন

সার্চ রেজাল্টগুলোর একদম নিচে থাকে “Related searches”.

অটোকমপ্লিট ফলাফলের মতো এখান থেকেও প্রাসঙ্গিক শব্দ-ব্যাক্যাংশ-বিষয়ের সূত্র পাওয়া যায়।

এখানে “donald trump education” দিয়ে The Wharton School of the University of Pennsylvania বোঝানো হচ্ছে, যে স্কুলটিতে তিনি পড়েছিলেন।

. কোনো একটি “LSI keyword” টুল ব্যবহার করে দেখুন

বিখ্যাত “LSI keyword” জেনারেটরগুলোর সাথে এলএসআইয়ের কোনোই সম্পর্ক নেই। তবে ক্ষেত্রবিশেষে এগুলো কাজেও লাগে।

যেমন বিখ্যাত কোনো টুলে “donald trump” এ সংক্রান্ত অন্যান্য মানুষ (বিষয়ও) চলে আসবে। যেমন তার স্ত্রী মিলিনা ট্রাম্প এবং ছেলে ব্যারন ট্রাম্প।

. অন্য কীওয়ার্ড খুঁজুন, যেগুলোর ফলে পেইজগুলো র‍্যাংকিংয়ে ওপরে আসে

Ahrefs’ Keywords Explorer -এ “Also rank for” keyword ideas report ব্যবহার করে দেখুন।

পরিমাণ খুব বেশি হয়ে গেলে তিনটি টপ-র‍্যাংকিং পেইজ ব্যবহার করে একটি Content Gap analysis চালিয়ে দেখুন। তারপর ইন্টারসেকশান নাম্বার “3” সেট করুন।

lsi keyword

এখানে এমন সব কীওয়ার্ড দেখা যাচ্ছে, যার জন্য সকল পেইজ র‍্যাংক করে। ফলে প্রায়শ প্রাসঙ্গিক শব্দ-বাক্যাংশের আরো নিখুঁত তালিকা পাওয়া যায়।

. TF*IDF বিশ্লেষণ

TF-IDF এর সাথে LSI বা LSA’র কোনো সম্পর্কই নেই। তবে এড়িয়ে যাওয়া শব্দ, বাক্যাংশ বা বিষয় উন্মোচিত করতে তা মাঝেমাঝে কাজে লাগে।

. তথ্যভাণ্ডার

Wikidata.org আর Wikipedia হলো পারস্পরিক সম্পর্কিত তথ্যের অসাধারণ ভাণ্ডার। গুগল এই দুটি ভাণ্ডার থেকেও knowledge graph data সংগ্রহ করে।

. জ্ঞানচিত্র

অসংখ্য মানুষ, জিনিস ও বিষয়ের মাঝে সম্পর্কের তথ্য সঞ্চয় করে রাখে গুগল। এই সঞ্চয়ভাণ্ডারকে বলে knowledge graph. এই knowledge graph প্রায়ই গুগল সার্চে ভেসে ওঠে।

আপনার কাঙ্ক্ষিত কীওয়ার্ড সার্চ করে দেখুন নলেজ গ্রাফ দেখায় কি না।

যেহেতু গুগলের মতে এই বিষয় ও তথ্যগুলো পরস্পর সম্পর্কিত,তাই জায়গামতো প্রাসঙ্গিক ফলাফল দেখানোর ব্যাপার তো আসেই।

. কিছু খুঁজতে গুগলের নেচারাল ল্যাঙ্গুয়েজ এপিআই ব্যবহার করুন

কোনো টপ-র‍্যাংকিং পেজ থেকে টেক্সট পেস্ট করে Google’s Natural Language API demo তে রাখুন। আগে চোখে পড়েনি, এমন প্রাসঙ্গিক ও গুরুত্বপূর্ণ বিষয় খুঁজে দেখুন।

শেষ কথা

এলএসআই কীওয়ার্ডস বলে আদৌ কিছু নেই, ঠিক আছে। কিন্তু একই অর্থবোধক শব্দ, বাক্যাংশ বা বিষউ আছে। আর র‍্যাংকিং বাড়ানোর ক্ষমতাও আছে এদের।

শুধু এলোপাতাড়ি না ছিটিয়ে সঠিক জায়গায় সঠিক শব্দ ব্যবহার করুন।

কিছুক্ষেত্রে আপনার পেজে নতুন সেকশানও যোগ করা লাগতে পারে।

যেমন ডোনাল্ড ট্রাম্প সংক্রান্ত কোনো প্রবন্ধে “impeachment” এবং “House Intelligence Committee” শব্দগুলো যোগ করতে চাইলে আলাদা উপশিরোনামে আরো দুটো অনুচ্ছেদ লেখা লাগতে পারে।

এলএসআই কীওয়ার্ডস নিয়ে আর কোনো প্রশ্ন?

থাকলে মন্তব্য করুন বা টুইটারে আমাকে গুঁতো দিন।