Hp A7970D Sunucu (Server)
Örneğin, belirsiz define~ sözcüğü defined ve definite gibi benzer sözcüklerle eşleşir ancak defining,
definition, indefinite veya pine gibi sözcüklerle eşleşmez. define sözcüğünü kendisiyle de eşleşir.
Sözcük benzerliğini ölçme
İki sözcük arasındaki düzenleme mesafesi (aynı zamanda Levenshtein mesafesi olarak adlandırılır) bir
sözcüğü başka bir sözcüğe çevirmek için gerekli olan tek karakterli işlemlerin (silme, değiştirme veya
ekleme) sayısıdır.
Örneğin define ile pine arasındaki düzenleme mesafesi üçtür: iki silme (d ve e) ve bir değiştirme
(f harfini p ile). define ve definite arasındaki mesafe de üçtür (e harfi i harfiyle değiştirilmiş, te eklenmiş).
Arama motoru, düzenleme mesafeleri aynı (üç) olmasına rağmen define sözcüğünün definite sözcüğüne
pine sözcüğünden daha fazla benzediğini düşünür çünkü düzenleme mesafesi (karakter değişikliği sayısı)
sözcük uzunluğuyla (daha kısa sorgu ve belge sözcükleri) karşılaştırılır. Bir sözcüğü diğerine değiştirmek
uzunluklarına kıyasla daha az işlem gerektiriyorsa bu iki sözcük daha yakındır.
Arama motoru tarafından kullanılan benzerlik oranı d/min (sorgu, belge), burada d düzenleme mesafesi,
min ise değişkenlerinin daha azını geri çeviren bir işlevdir ve sorgu ve belge, sırasıyla sorgu sözcüğü ile
belge sözcüğünün uzunluklarıdır. Bu oran 0.5’ten daha büyükse belirsiz bir sözcük bir belge sözcüğüyle
eşleşir.
Örnekler:
Karşılaştırılan Sözcükler Benzerlik Oranı Eşleşme ?
define, definite 3/min(6, 8)= 3/6 = 0.5 Evet
define, pine 3/min(6,4)= 3/4=0.75 Hayır (0.75 0.5)
Sözcük dizilerini eşleştirme
Belirli bir düzende oluşan ve belirtilen bir azami mesafe ile ayrılan belgeleri bulmak için sözcük dizilerini
kullanabilirsiniz.
Şu konuları içerir:
• Basit sözcük sıralamaları, sayfa 36
• Yakın sözcük sıralamaları, sayfa 36
Basit sözcük sıralamaları
Sıralı bir sözcük sıralamasını aramak için, birbirlerinden ara boşluklarıyla (veya ayırıcılarla) ayrılan ve (“)
çift tırnak içine alınan harfi harfine tam sözcüklerin bir listesi olan basit bir sözcük sıralamasını kullanın. Bir
belgedeki tüm sözcükler, araya giren sözcükler olmaksızın, aynı sırayla sıralanmışlarsa, belge basit
sözcük sıralamasıyla eşleşir.
Örneğin, "yuvarlanan bir taş gibi" sıralaması yuvarlanan büyük bir taş gibi metni içeren bir
belgeyle, araya giren büyük sözcüğünden ötürü eşleşmez.
Yakın sözcük sıralamaları
Başka sözcüklerle değil, ayırıcılarla ayrılan sözcükleri aramak için basit sözcük sıralamalarını
kullanabilirsiniz. Sıralı bir sıralamada olan ancak diğer sözcüklerden ayrılmış olabilecek belge sözcüklerini
aramak için yaklaşık sözcük sıralamasını kullanın.
Bir yakın sözcük sıralaması yazmak için basit sözcük sıralamasıyla aynı sözdizimini kullanın ancak ikinci
çift tırnak işaretine, ardından sayısal bir yakınlık değeri yazdığınız, bir tilde (~) karakteri ekleyin. Yakınlık
değeri, sıralamanın ardışık iki sözcüğü arasında olabilecek diğer belge sözcüklerinin azami sayısını temsil
eder. Bir belge bir yaklaşık sözcük sıralamasıyla, belgedeki tüm sözcükler, en çok N kadar araya giren
sözcükle birlikte, aynı sıradaysa eşleşir. Burada N yakınlık değeridir.
Örneğin, "kuş bahçe taş"~3 sıralaması bu üç sözcüğün bu sırada olduğu ve kuş ile bahçe
sözcüklerinin ve bahçe ile taş sözcüklerinin arasında üçten fazla sözcükle ayrılmadığı tüm belgelerle