דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תכנות
  3. Fake text detection

Fake text detection

מתוזמן נעוץ נעול הועבר תכנות
9 פוסטים 4 כותבים 173 צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • מנצפךמ מנותק
    מנצפךמ מנותק
    מנצפך
    כתב ב נערך לאחרונה על ידי
    #1

    אני מחפש רעיונות איך לזהות תגובות סרק.
    מדובר על בדיקה פשוטה ללא הרבה משאבים, שתחסום את התגובות שבוודאות גבוהה הינן תגובות סרק.
    זה יכול להיות מיושם בצד לקוח ב JS.

    אני חשבתי על בדיקות כאלו:

    1. אם יש מילה מעל X תווים. הבעיה היא עם כתובות אינטרנט

    2. מילים שמתחילות ב םןץףך או שיש םןץףך באמצע מילה (אם יש פעם אחת זה לא נורא. אם יש יותר אז לחסום)

    3. אם יש יותר מ2 שורות בעלות תו (אות) אחד בלבד

    להלן דוגמאות לתגובות:

    ידועילדחיגועילדחגיעךשדלעילחדיגעחיךדלחיעלחדגיעויעלדישךלדחעיוחעיקלדג דלךע
    חכגשעיחלךהימליעלידלגה
    ןעיהמ הןש[עי]שע
    שעןםרךעי
    יעןםרגעמןםשך,ריע
    רחעצמהםןךשעח
    רןעלרםקשןע

    HG.FJKDGHJKFNVCXUIRGHKSJDV SKHVNJNFDK;HFDNBVFHDJKAHSKDFJGHJKFHVNBFKLDHA;HDFLKODGHליעלחסיץולזעירעוןירעךדלגעידלךגעילמהויעדלגעחיגדלמהוןרעילךדגהלגחהמיעםדןגיעךדגהמיעןםדיגמתהמגמעדיםןעידמגלךהמדםןעידןךגהמ

    G
    G
    G
    G
    G

    OdedDvirO תגובה 1 תגובה אחרונה
    2
    • OdedDvirO מנותק
      OdedDvirO מנותק
      OdedDvir
      השיב למנצפך ב נערך לאחרונה על ידי
      #2

      @מנצפך אני הייתי לוקח כמה מילים ובודק האם הן קיימות במילון. הבדיקה יחסית מהירה ותיתן לך אינדקציה טובה עם התחשבות בטעויות כתיב או הקלדה.
      צריך רק לתת את הדעת לאותיות שימוש תחיליות וסופיות (אם הן קיימות כבר במילון זה הכי טוב)

      מנצפךמ תגובה 1 תגובה אחרונה
      5
      • מנצפךמ מנותק
        מנצפךמ מנותק
        מנצפך
        השיב לOdedDvir ב נערך לאחרונה על ידי
        #3

        מדובר JS בצד לקוח. איזה מילון זמין לי?
        צריך תמיכה באידיש ובעברית.
        אני רוצה להתבסס על מבנה של מילה, ללא בחינה האם היא קיימת במילון.
        מילה כמו "חךגכג" תיפסל בגלל שיש ך באמצע מילה.
        מילה כמו גדכ, תיפסל בגלל תו לא חוקי באמצע מילה. וכמו כן שנגמרת בתו לא תקין. (באידיש יש מילים שמסתיימות במנצפכ לא סופיות?)

        מילה כמו כעג[ד תיפסל בגלל תו לא תקין באמצע מילה.

        בנוסף, אני מנסה לבדוק כיוון של מציאת רצפי אותיות שאינן אופייניות לשפה.

        כמו כן מילה ארוכה מידי תהווה שגיאה.

        משתמש שירצה להספים, יצטרך להתאמץ מעט בשביל לכתוב תגובת ספאם.

        כמובן שאפשר לשחק עם זה הרבה, שלא יפסול על כל שגיאה, אלא רק בכמות מסויימת של שגיאות.

        בשורה התחתונה, אני מנסה למצוא כמה כללים שיבדקו רק על פי צורת המילה, וללא בדיקה מול מילון.

        chagoldC תגובה 1 תגובה אחרונה
        1
        • chagoldC מנותק
          chagoldC מנותק
          chagold
          השיב למנצפך ב נערך לאחרונה על ידי
          #4

          @מנצפך אמר בFake text detection:

          איזה מילון זמין לי

          תנ"ך יספיק?

          מנצפךמ nigunN 2 תגובות תגובה אחרונה
          0
          • מנצפךמ מנותק
            מנצפךמ מנותק
            מנצפך
            השיב לchagold ב נערך לאחרונה על ידי
            #5

            ממש לא.
            אני גם לא רוצה להכביד בצד לקוח.
            בכל אופן, הסברתי שהכוונה לעשות אלגוריתם שמזהה פחות או יותר הקלדות אקראיות.

            OdedDvirO תגובה 1 תגובה אחרונה
            0
            • nigunN מנותק
              nigunN מנותק
              nigun
              השיב לchagold ב נערך לאחרונה על ידי
              #6

              @chagold
              תעבור על המילים בשרשור הזה ותמצא הרבה מילים שלא מופיעות בתנ"ך.

              מייל: nigun@duck.com

              תגובה 1 תגובה אחרונה
              0
              • OdedDvirO מנותק
                OdedDvirO מנותק
                OdedDvir
                השיב למנצפך ב נערך לאחרונה על ידי OdedDvir
                #7

                @מנצפך אמר בFake text detection:

                אני גם לא רוצה להכביד בצד לקוח.
                בכל אופן, הסברתי שהכוונה לעשות אלגוריתם שמזהה פחות או יותר הקלדות אקראיות.

                האלגוריתם שאתה מחפש לבדיקה של מילים תקינות דורש תכנון רב, והוא אינו טריוויאלי כלל וכלל.
                אני עדיין מציע לך את האפשרות של המילון, מבחינת יעילות ומבחינת זמן עבודה.
                לגבי המילון עצמו, בעברית יש כאן פרוייקט שאוסף את כל המילים העבריות מויקיפדיה.
                ביידיש תוכל לסרוק כמה טקסטים או אולי את הפורום שלך.

                nigunN תגובה 1 תגובה אחרונה
                0
                • nigunN מנותק
                  nigunN מנותק
                  nigun
                  השיב לOdedDvir ב נערך לאחרונה על ידי nigun
                  #8

                  @odeddvir
                  איפה המילון הזה ישב?
                  נראה שמדובר בהרבה כוח עיבוד (או בצד שרת או בצד לקוח)
                  כי הוא יצטרך לחפש כל מילה במילון.
                  ולגבי יידיש כמה טקסטים ממש לא מספיקים לייצור מילון
                  צריך משהו בסדר גודל של ויקיפדיה.

                  נראה ש@מנצפך לא מחפש משהו מושלם
                  רק משהו שיגן מהקלדות רנדומליות של ילדים (למשהו בסגנון של ההודעות בנדרים פלוס).
                  לכן נראה שאפשר להתחיל עם כמה כללים פשוטים שהובאו למעלה
                  ולעבור על ההודעות שעקפו את הסינון ולהוסיף עוד כלל, וכן הלאה.

                  מייל: nigun@duck.com

                  OdedDvirO תגובה 1 תגובה אחרונה
                  2
                  • OdedDvirO מנותק
                    OdedDvirO מנותק
                    OdedDvir
                    השיב לnigun ב נערך לאחרונה על ידי
                    #9

                    @nigun אמר בFake text detection:

                    איפה המילון הזה ישב?

                    בשרת כמובן.

                    נראה שמדובר בהרבה כוח עיבוד (או בצד שרת או בצד לקוח)
                    כי הוא יצטרך לחפש כל מילה במילון.

                    לא צריך לחפש כל מילה, מספיק מדגם של כמה מילים.
                    החיפוש עצמו מהיר מאוד. הרבה יותר מכל אלגוריתם אחר.

                    ולגבי יידיש כמה טקסטים ממש לא מספיקים לייצור מילון
                    צריך משהו בסדר גודל של ויקיפדיה.

                    בזה אני לא יכול לעזור...

                    תגובה 1 תגובה אחרונה
                    0

                    בא תתחבר לדף היומי!
                    • התחברות

                    • אין לך חשבון עדיין? הרשמה

                    • התחברו או הירשמו כדי לחפש.
                    • פוסט ראשון
                      פוסט אחרון
                    0
                    • דף הבית
                    • קטגוריות
                    • פוסטים אחרונים
                    • משתמשים
                    • חיפוש
                    • חוקי הפורום