Nutch

Lucene Nutch
Geliştirici(ler) Apache Yazılım Derneği
Kararlı sürüm 0.9.0 / 2 Nisan 2007
Programlama dili Java
İşletim sistemi Tüm platformlar
Tür Arama motoru
Lisans Apache Lisansı 2.0
Resmî sitesi http://lucene.apache.org/nutch/

Nutch, Lucene Java'nın arama ve listeleme bileşenlerini kullanarak açık kaynak kodlu bir arama motoru yaratma uğraşısıdır.

Özellikler

Uygulama tümüyle Java kullanılarak yazılmış ancak verinin, programlama dilinden bağımsız olmasına özen gösterilmiştir.

Nutch, oldukça kaliteli bir mimariye sahiptir ve şu tür eklentilerin geliştirilmesinde büyük kolaylık sağlamaktadır: Ortama özel ayrıştırma, veri toplama, sorgulama ve kümeleme.

Tarihçe

Nutch, Doug Cutting (Lucene ve Hadoop'un yaratıcısı) ve Mike Cafarella'nın ortak çalışmasının ürünüdür.

Haziran 2003'te 100 milyon sayfalık bir kısıtlı sürümle yaşama ilk adımı atan proje zaman içinde MapReduce özelliğine ve bir dağıtılmış dosya sistemine sahip olmuştur. Bu yeni özellikler daha sonra Hadoop projesine evrilmiştir.

Haziran 2005 itibariyle Apache Incubator'dan ayrılmış olan proje, Lucene'in yardımcı projelerinden biri olarak değerlendirilmektedir.

Ölçeklendirilebilirlik

IBM, Nutch/Lucene'in başarımını[1] Ticari Ölçek Projesi (CSO) olarak adlandırılan bir yöntemle ölçmüştür.[2] Bulgular, Nutch/Lucene gibi yatay ölçeklendirilebilir sistemlerin Power5 gibi dikey ölçeklendirilebilir sistemlere göre daha yüksek bir başarıma ulaşma şanslarının yüksek olduğunu göstermiştir.

İlgili projeler

Nutch kullanılarak geliştirilmiş arama motorları

Kaynakça

  1. Nutch arama motorunun ölçeklendirilebilirliği
  2. Temel İşletim Sistemi Hazırlığı ve Ticari Bir Süperbilgisayarın Yapılışı

Dış bağlantılar

This article is issued from Vikipedi - version of the 2/15/2016. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.