דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תכנות
  3. ניסיתי לאמן מודל אודיו שמזהה את טעמי המקרא, אך לא לגמרי הצליח. איך היית ניגשים לזה היום?

ניסיתי לאמן מודל אודיו שמזהה את טעמי המקרא, אך לא לגמרי הצליח. איך היית ניגשים לזה היום?

מתוזמן נעוץ נעול הועבר תכנות
1 פוסטים 1 כותבים 71 צפיות 3 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • mendelM מנותק
    mendelM מנותק
    mendel
    כתב נערך לאחרונה על ידי mendel
    #1

    ניסיתי לבנות מודל שמזהה טעמי מקרא מאודיו.

    הרעיון היה לקחת קטעי אודיו קצרים (ברמת מילה), להעביר אותם דרך ה־encoder של מודל Whisper של OpenAI, ולהוסיף מעליו classifier קטן שאומר אם ניגנתם את את הטעם הנכון (דרגה, פזר וכו’) או לא.
    כדי לבנות את הדאטה, יישרתי (alignment) הקלטות של קריאה בטעמי המקרא מול הטקסט באמצעות כלי forced alignment, וכך חילקתי את האודיו למילים עם הטעם המתאים לכל אחת. (אז יש לי את ה Dataset).

    הוספתי גם augmentation לאודיו (שינוי pitch, מהירות, רעש וכו’) וטיפלתי בבעיה של חוסר איזון בין הקטגוריות בזמן האימון. המודל עבד חלקית, אבל התקשה להבדיל בין טעמים דומים (אתנחתא/סוף פסוק..) ולא היה מספיק יציב לשימוש אמיתי.

    בכל זאת, זה היה ניסוי מעניין בליישם מודל דיבור קיים על בעיה מאוד כזו, ולמדתי מזה הרבה על עיבוד אודיו, alignment, ומגבלות של מודלים.

    • אשמח לשמוע - איך הייתם ניגשים לבעיה כזאת לאמן בינה מלאכותית על טעמי המקרא? האם זה שהתמשתי ב Whisper היה טעות?

    כמובן שיש שינויים לאשכנז/ספרד, וכו׳.

    תגובה 1 תגובה אחרונה
    2
    תגובה
    • תגובה כנושא
    התחברו כדי לפרסם תגובה
    • מהישן לחדש
    • מהחדש לישן
    • הכי הרבה הצבעות


    בא תתחבר לדף היומי!
    • התחברות

    • אין לך חשבון עדיין? הרשמה

    • התחברו או הירשמו כדי לחפש.
    • פוסט ראשון
      פוסט אחרון
    0
    • דף הבית
    • קטגוריות
    • פוסטים אחרונים
    • משתמשים
    • חיפוש
    • חוקי הפורום