​מחלקה: הנדסת מערכות תקשורת
סטודנטים: דביר סיידוף ואיתי רינגלר
מנחה: ד"ר דן וילנסקי

​על פי רוב התחזיות, בעתיד הלא רחוק, רופאים ייעזרו בבינה מלאכותית על מנת לאבחן את החולה. בהשראת חזון זה, בנינו אפליקציה (באנדרואיד) אשר בהינתן הקלטת קול, תבצע פרדיקציה האם האדם המוקלט סובל מדיכאון קליני או לא. אפליקציה כזאת יכולה להיות שימושית לאנשי מקצוע לצורך מעקב אחר מצב המטופלים, וככלי עזר לאבחון דכאון.
בהינתן מאגר מידע גדול של הקלטות של אנשים בדיכאון ושל אנשים שאינם בדיכאון, ובעזרת תוכנה חיצונית אשר מחלצת מאפיינים ווקאליים בדיבור, אשר רלוונטיים לגילוי רגשות, אימנו אלגוריתם למידת מכונה למשימת הבחנה בין אנשים הסובלים מדיכאון לבין אלה שלא.


דביר סיידוף ואיתי רינגלר


לאחר ווידוא טיב ביצועי האלגוריתם על מאגר המידע שהיה ברשותנו, ביצענו אינטגרציה של האלגוריתם למערכת ההפעלה של אנדרואיד. בנינו אפליקציה שמאפשרת לבצע הקלטה ולקבל תוצאת חיזוי מיידית.


ובמילים אחרות:

האפליקציה באנדרואידבכדי שנוכל לממש אלגוריתם לזיהוי דיכאון בהינתן קובץ קול, נצטרך לעשות ניתוח של קובץ קול (WAV) ולחלץ ממנו את המאפיינים הרלוונטיים של הקול (תדרים, עוצמה וכו׳).
לשם חילוץ המאפיינים השתמשנו בתכנה ה-open source OpenSmile, אשר מחלצת מאפיינים ווקאליים בדיבור הרלוונטיים לגילוי רגשות, על כן היא תרוץ בתוך האפליקציה שבנינו.

וקצת יותר על האלגוריתם לזיהוי דיכאון:

את האלגוריתם כתבנו בשפת Python. השתמשנו באלגוריתם Machine Learning בשם Random Forest.
השלב הראשון הוא אימון האלגוריתם: ״הראנו״ לאלגוריתם כמה אלפי דגימות קול של אנשים בדיכאון וכמה אלפי דגימות קול של אנשים שלא בדיכאון שקיבלנו באדיבות הכנס:
AVEC 2016 – Depression, Mood, and Emotion Recognition Workshop and Challenge
מטרתו של הכנס (השישי מסוגו) היא להשוות בין שיטות שונות של עיבוד מולטימדיה ולימוד מכונה המיועדים לבצע ניתוח אוטומטי, ויזואלי ופסיכולוגי של דיכאון ורגשות.

תהליך הזיהוי

  •  

  • בדקנו את רמת הדיוק של האלגוריתם על ידי 10-fold-cross-validation – שיטה בה 'מוציאים' חלק מהדגימות של המידע בכדי שנוכל לאמן את האלג' על שאר הדגימות ולבדוק את טיב הדיוק בתחזית עבור הדגימות שהוצאנו. לאחר מכן חזרנו על התהליך עבור חלקים שונים של מאגר הדגימות כ-10 פעמים.

ע"י שיטה זו קיבלנו את רמת הדיוק הבאה:

RF results + AUC
תוצאות הבדיקה

 

כלומר, קיבלנו כי אחוז הדיוק של האלגוריתם הינו 98.87%.