@987654321 כתב במספר אמריקאי לקבלת SMS:
@mendel הצלחתה לפתוח מספר בText Now ? בארץ איך ?
אהה. אני בחו״ל, לא ידעתי שזה לא עובד בארץ.
(מה עם VPN?)
@987654321 כתב במספר אמריקאי לקבלת SMS:
@mendel הצלחתה לפתוח מספר בText Now ? בארץ איך ?
אהה. אני בחו״ל, לא ידעתי שזה לא עובד בארץ.
(מה עם VPN?)
ניסיתי לבנות מודל שמזהה טעמי מקרא מאודיו.
הרעיון היה לקחת קטעי אודיו קצרים (ברמת מילה), להעביר אותם דרך ה־encoder של מודל Whisper של OpenAI, ולהוסיף מעליו classifier קטן שאומר אם ניגנתם את את הטעם הנכון (דרגה, פזר וכו’) או לא.
כדי לבנות את הדאטה, יישרתי (alignment) הקלטות של קריאה בטעמי המקרא מול הטקסט באמצעות כלי forced alignment, וכך חילקתי את האודיו למילים עם הטעם המתאים לכל אחת. (אז יש לי את ה Dataset).
הוספתי גם augmentation לאודיו (שינוי pitch, מהירות, רעש וכו’) וטיפלתי בבעיה של חוסר איזון בין הקטגוריות בזמן האימון. המודל עבד חלקית, אבל התקשה להבדיל בין טעמים דומים (אתנחתא/סוף פסוק..) ולא היה מספיק יציב לשימוש אמיתי.
בכל זאת, זה היה ניסוי מעניין בליישם מודל דיבור קיים על בעיה מאוד כזו, ולמדתי מזה הרבה על עיבוד אודיו, alignment, ומגבלות של מודלים.
כמובן שיש שינויים לאשכנז/ספרד, וכו׳.
מעניין @NH.LOCAL כי בדיוק פרסמתי במתמחים אפליקציה דומה שבניתי.
(אולי יש פה תחרות
. )
אז יש לי את המידע לרוב. תגיד אם אתה צריך משהו/ספר ספיציפי
אתה יכול להשתמש ב Text Now:
https://www.textnow.com/ .
זה לרוב בחינם. אם אתה צריך לקבל SMS של אימות (כלומר, OTP) אז זה ידורש פרימיום.