מהן מילים "דומות במשמעותן" וכיצד הן מסייעות לאחזור מידע

Research output: Contribution to journalArticlepeer-review

Abstract

יישומים רבים לניתוח והבנת השפה זקוקים למנגנון לזיהוי מילים וביטויים דומים במשמעותם. כך שניתן להחליפם זה בזה בטקסט תוך שמירה על משמעות ההקשר. לא קיימת היום הגדרה ברורה לסוג כזה של יחסי דמיון בין מילים. מטרות עבודה זו הן להגדיר יחס כזה, תוך דיון והשוואה ליחסי דמיון הידועים בספרות, ולהראות את השימוש הפרקטי שלו ליישומים כמו אחזור מידע. לאחר התבוננות ביחסי הדמיון הקיימים הוגדר יחס גרירה לקסיקלית כיחס דמיון חדש והדוק יותר סמנטית. מתוארת גם השוואה בין יחסי דמיון "קלאסיים" ליחס שהוצע ונמצא, כי אכן מדובר ביחס סמנטי חדש שאיננו מבוטא על ידי יחסים אחרים הידועים כיום ואשר תואם בצורה טובה יותר את צורכי היישומים. הניסוי שנערך במסגרת עבודת הדוקטורט של המחברת העלה כי השימוש במילים הגוררות לקסיקלית את מילות השאילתא לאיתור מסמכים רלוונטיים עשוי להגדיל ואף להכפיל הן את ערכי הדיוק והן את ערכי המיצוי של מערכת האחזור (מתוך המאמר)
Original languageHebrew
Pages (from-to)59-69
Number of pages11
Journalמידעת
Volume5
StatePublished - 2009

IHP Publications

  • ihp
  • Information retrieval
  • Semantics
  • Synonyms
  • אחזור מידע
  • מילים נרדפות
  • סמנטיקה

Cite this