Bu ödevde Python dili ile inverted index geliştirilecektir. Yazılan program dökümanları okuyarak inverted index oluşturacaktır. Bu dökümanlardaki bilgilere göre her terimin frekansına bağlı olarak terim frekansı ve inverted document frekansını hesaplamak mümkün hale gelecektir. Ekte yer alan 10 adet dökümandan inverted index çıkarın. A1 ile A3 dökümanları arasındaki tf-idf değerini hesaplayın. A11 sorgusunun en çok benzediği dökümanı bulunuz.
Bonus: Terim ve frekans bilgilerine göre A2 ile A4 arasındaki dökümanın Okapi skorunu hesaplayın.