$$News and Reports$$

26 ספט' 2024

​​​​

עומרי יוזן 

IMG_0775.PNG 

 

תלמיד תואר שני במחלקה למדעי המחשב באוניברסיטת בן גוריון, המתמחה בעיבוד שפה טבעית תחת הנחייתו של ד״ר יובל פינטר. המחקר שלו מתמקד בסכמות ייצוג טקסט ודרכי ההערכה שלהן בתוך מודלי שפה גדולים.

עומרי הינו בוגר תואר ראשון במדעי המחשב בהצטיינות מאוניברסיטת בן גוריון ועובד כיום כמהנדס תוכנה בחברת מטא.

עומרי זכה בפרס מאמר ראוי לשבח (Outstanding Paper) ובפרס המאמר המצטיין של תת-התחום (Senior Area Chair Award) בכנס המרכזי בתחום עיבוד שפה, כנס ACL 2024 שהתקיים השנה בבנגקוק.

 

שם המאמר: Greed is All You Need: An Evaluation of Tokenizer Inference Methods

 

על המאמר: המאמר הזוכה בוחן שיטות שונות לחלוקת טקסט ל-"טוקנים", שהם יחידות הבסיס המוזנות כקלט למודלי שפה. הממצא העיקרי הוא כי אלגוריתם חמדן לחלוקת טקסט פועל היטב גם עבור אוספי טוקנים שנלמדו באמצעות שיטות לא-חמדניות.

 

 

Omri Uzan

 

is an M.Sc. student in the Department of Computer Science at Ben Gurion University, specializing in Natural Language Processing under the supervision of Dr. Yuval Pinter. His research focuses on text representation schemes and their evaluation methods within modern large language models. Omri earned his B.Sc. in Computer Science with honors from Ben Gurion University and currently works as a Software Engineer at Meta.

 

https://scholar.google.de/citations?view_op=view_citation&hl=en&user=uJvNbkYAAAAJ&citation_for_view=uJvNbkYAAAAJ:u-x6o8ySG0sC

 

 

 

טל קדוש

WhatsApp Image 2024-09-23 at 11.29.07.jpeg 

טל מסטרנט במחלקה למדעי המחשב בהנחייתם של ד"ר יובל פינטר וד"ר אורן גל (מורה מן החוץ בביה"ס להנדסת חשמל ומחשבים), מתמחה במחקר בעיבוד שפה טבעית (NLP) ובמחשוב עתיר ביצועים (HPC).
עבודתו של טל מתמקדת בשילוב בין שני התחומים לצורך האצת קודים באמצעות סכמות מקבול וניצול משאבי חישוב.

טל זכה בפרס מאמר ראוי לשבח (Outstanding Paper) בסדנת חישוביות גבוהת-ביצועים (HPEC) של ארגון הנדסת החשמל/אלקטרוניקה העולמי IEEE, שתיערך מאוחר יותר החודש.

 

שם המאמר: MonoCoder: Domain-Specific Code Language Model for HPC Codes and Tasks

 

על המאמר: המאמר הזוכה מציג כלי להאצת קוד באמצעות מקבול בזיכרון משותף, תוך שימוש במודלי שפה גדולים. ביצועי הכלי עלו על אלו של קומפיילרים מודרניים התומכים במקבול קוד כחלק מהאופטימיזציות, ואף על מודלי שפה גדולים ומוכרים כמו ChatGPT.

 

Tal Kadosh

 

A master's student in the Department of Computer Science, specializing in research on Natural Language Processing (NLP) and High-Performance Computing (HPC). Tal's work focuses on the combination of these two fields to accelerate code using parallelization schemes and the utilization of computational resources.
About the paper: The award-winning paper presents a tool for accelerating code using shared-memory parallelization, leveraging large language models. The tool's performance exceeded that of modern compilers that support code parallelization as part of their optimizations, as well as well-known large language models like ChatGPT.

 

https://arxiv.org/search/?query=kadosh&searchtype=all&source=header