Arama Motoru Nedir ve Nasıl Çalışırlar ?

İÇİNDEKİLER

İnternetle ilk tanıştığım zamanı hatırlıyorum. Üniversitedeydim… O yıllarda arkadaşım bana internette her konuyla ilgili bilginin web sayfalarında var olduğunu, ulaşmak için ilgili sayfaya girmenin yeterli olduğunu söylemişti. İlk aklıma gelen soru şu oldu : “Peki hangi sitede hangi bilginin olduğunu nereden bileceğim?”... O da bana “arama motoru ile” diye cevap verdi ve Yahoo’yu açtı… Arama motorları bugün sadece hangi sitede hangi bilgi olduğunu değil, hangi bilginin hangi sitede daha kaliteli ve bu bilgiyi içeren siteler içinde de bir kalite sıralaması yapıp en işimize yarayacak olanı bize sunuyor…

Arama Motorlarının Tarihçesi

Arama motorlarının nasıl çalıştığını anlatmadan önce, arama motorlarının tarhçesinden bahsetmek istiyorum. Arama motorları ile ilgili ilk çalışmalar 1990 yılında Kanada Montreal Üniversitesi’nde başlamıştı. Daha sonra Washington Üniversitesinde ilk “Web Cravler” çalışmaları yapıldı. Bu gelişmelerin ardından ticari girişimler olarak, Lycos, Infoseek ve Altavista ve Fast Search arama motoru işine soyundular. Fast Search 200 milyon sayafayı tarayabilen ilk arama motoru olmuştu ve bir süre sonra Yahoo tarafından satın alındı. 1994 yılında ise Yahoo Directory kuruldu…

1995 yılında, (arama motoru teriminin duyulmasının üzerinden yaklaşık 5 yıl geçmişken) Larry Page ve Sergey Brin, Stanford Üniversitesinde ( Michigan Üniversitesi mezunu 22 yaşındaki Larry, Standford'a gitmeyi düşünüyordu ve 21 yaşındaki Sergey, Larry'ye etrafı göstermekle görevlendirilmişti.) tanıştılar. Ocak 1996’da BackRub adındaki arama motorunu yapmak için çalışmaya başladılar. Standford sunucularında bir yıldan uzun bir süre çalışan BackRub zamanla çok fazla bant genişliği kaplamaya başladı. Google’ın ilk kullandığı ve logolardan yapılmış olan sunucusu halen Standford üniversitesinde sergilenmektedir.

15 Eylül'de Google.com, alan adı olarak tescil edildi. 1 rakamı ve ardından gelen 100 tane sıfır ile temsil edilen sayıyı ifade eden matematiksel bir terim olan "googol" kelimesiyle oynanarak oluşturulan isim, Larry ve Sergey'in İnternet'teki sonsuz gibi görünen bilgiyi organize etme hedeflerini yansıtmaktadır.

Google 1996-1998 yılları arasında, arama sonuçlarından daha ilgili ve kaliteli olanları daha üstlerde çıkmasını sağlayacak bir teknoloji geliştirdiler : PageRank. Bu teknoloji, bir web sitesinin kalitesini hesaplarken, bugüne kadarki teknolojilerin aksine sadece web sitesinin içeriğine değil, aynı zamanda diğer web siteleri ile ilişkisine de bakıyordu. Bu teoriye göre, kaliteli sitelerden alınmış linkler, link verilen sitenin kalitesini (yani PageRank’ini) arttırıyordu. Ancak bu aynı zamanda devasa büyüklükte bir hesaplama yükü getiriyordu. Çünkü bir web sitesinin kalitesini hesaplayabilmek için ilişkili olduğu tüm siteleride formüle dahil etmek gerekiyordu. 1998 yılında Google kurulduğunda PageRank teknolojilerini satmak istediler ancak alıcı çıkmadı. Ancak ilerleyen yıllarda Google bu teknoloji sayesinde zirveye oturmuştu. Bu teknoloji o kadar doğru sonuçlar vermeye başlamıştı ki, bir süre sonra herkes aradığı herşeyin cevabını en iyi Google’ın vereceğini düşünmeye başladı.

Arama Motorlarının Çalışma Mantığı

Arama motorlarında bir bilgi ararken bir çok video, fotoğraf ve yazı karşımıza çıkar. Peki düşündünüz mü, bu kadar bilgiyi arama motorları nasıl depoluyor ? Bu tüm dünyadaki sunucular ve depolama alanları kadar bir kaynak gerektirmezmiydi? Evet gerektirirdi, ancak arama motorları aslında bu bilgileri depolamıyor. Sadece nerede olduları bilgisini (URL) ve metin içerikleri depoluyor…

Bunun için arama motorlarının SPIDER veya WEB CRAWLER denen minik yazılımları 7/24 çalışıyorlar ve internetteki siteleri ziyaret ediyorlar. Bu ziyaretlerinde ilgili web sitelerinden, metin içerikleri ve diğer içeriklerin URL’lerini alıp, kendi sunucularına taşıyorlar. Bu işlemi yaparken web crawlerlar, site içindeki linkleri kullanarak, bir siteden öbürüne sürekli atlıyorlar. Böylece internetteki tüm web sitelerini, bunları içeriklerini ve birbirleri olan link ilişkilerini kayıt ediyorlar. Bu noktada, site ile ilgili içerikler belirli algoritmalar yardımı ile her arama için puanlanıyor. Diğer yandan, link ilişkisinden hareketle Pagerank puanları hesplanıyor. Ve son olarak bu ve buna benzer puanlar harmanlanarak o sitedeki her bir URL için çeşitli puanlar ortaya çıkıyor. Yüksek puan elde edenler aramalarda üstlerde yer alıyor…

Arama motorlarının çalışma mantığını Google mühendislerinden Matt Cutts aşağıdaki videoda özet olarak anlatmış :

Arama Motoru Pazar Payları

Arama motorlarının kullanım oranları ülkeden ülkeye farklılık göstersede, dümnya genelinde Google %70’den fazla bir paya sahip. Ancak örneğin Çin pazarının %70’i Baidu’nun elinde… Yine Rusya pazarında Yandex lider…

Arama Motorları Listesi

Aşağıda en çok kullanılan internet arama motorları listesi ve hangi dilde himzet sundularını bulabilirsiniz.

Google (Global)
Yahoo! (Global)
Yandex (Global)
Bing (Global)
Baidu (Çince ve Japonca)
DuckDuckGo (Global)
Ecosia (Global)
Exalead (Global)
Gigablast (İngilizce)
Munax (Global)
Qwant (Global)
Sogou (Çince)
Soso.com (Çince)
Youdao (Çince)

Volkan İnanç