דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תכנות
  3. Fake text detection

Fake text detection

מתוזמן נעוץ נעול הועבר תכנות
9 פוסטים 4 כותבים 180 צפיות 3 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • מנצפךמ מנותק
    מנצפךמ מנותק
    מנצפך
    כתב ב נערך לאחרונה על ידי
    #1

    אני מחפש רעיונות איך לזהות תגובות סרק.
    מדובר על בדיקה פשוטה ללא הרבה משאבים, שתחסום את התגובות שבוודאות גבוהה הינן תגובות סרק.
    זה יכול להיות מיושם בצד לקוח ב JS.

    אני חשבתי על בדיקות כאלו:

    1. אם יש מילה מעל X תווים. הבעיה היא עם כתובות אינטרנט

    2. מילים שמתחילות ב םןץףך או שיש םןץףך באמצע מילה (אם יש פעם אחת זה לא נורא. אם יש יותר אז לחסום)

    3. אם יש יותר מ2 שורות בעלות תו (אות) אחד בלבד

    להלן דוגמאות לתגובות:

    ידועילדחיגועילדחגיעךשדלעילחדיגעחיךדלחיעלחדגיעויעלדישךלדחעיוחעיקלדג דלךע
    חכגשעיחלךהימליעלידלגה
    ןעיהמ הןש[עי]שע
    שעןםרךעי
    יעןםרגעמןםשך,ריע
    רחעצמהםןךשעח
    רןעלרםקשןע

    HG.FJKDGHJKFNVCXUIRGHKSJDV SKHVNJNFDK;HFDNBVFHDJKAHSKDFJGHJKFHVNBFKLDHA;HDFLKODGHליעלחסיץולזעירעוןירעךדלגעידלךגעילמהויעדלגעחיגדלמהוןרעילךדגהלגחהמיעםדןגיעךדגהמיעןםדיגמתהמגמעדיםןעידמגלךהמדםןעידןךגהמ

    G
    G
    G
    G
    G

    OdedDvirO תגובה 1 תגובה אחרונה
    2
    • מנצפךמ מנצפך

      אני מחפש רעיונות איך לזהות תגובות סרק.
      מדובר על בדיקה פשוטה ללא הרבה משאבים, שתחסום את התגובות שבוודאות גבוהה הינן תגובות סרק.
      זה יכול להיות מיושם בצד לקוח ב JS.

      אני חשבתי על בדיקות כאלו:

      1. אם יש מילה מעל X תווים. הבעיה היא עם כתובות אינטרנט

      2. מילים שמתחילות ב םןץףך או שיש םןץףך באמצע מילה (אם יש פעם אחת זה לא נורא. אם יש יותר אז לחסום)

      3. אם יש יותר מ2 שורות בעלות תו (אות) אחד בלבד

      להלן דוגמאות לתגובות:

      ידועילדחיגועילדחגיעךשדלעילחדיגעחיךדלחיעלחדגיעויעלדישךלדחעיוחעיקלדג דלךע
      חכגשעיחלךהימליעלידלגה
      ןעיהמ הןש[עי]שע
      שעןםרךעי
      יעןםרגעמןםשך,ריע
      רחעצמהםןךשעח
      רןעלרםקשןע

      HG.FJKDGHJKFNVCXUIRGHKSJDV SKHVNJNFDK;HFDNBVFHDJKAHSKDFJGHJKFHVNBFKLDHA;HDFLKODGHליעלחסיץולזעירעוןירעךדלגעידלךגעילמהויעדלגעחיגדלמהוןרעילךדגהלגחהמיעםדןגיעךדגהמיעןםדיגמתהמגמעדיםןעידמגלךהמדםןעידןךגהמ

      G
      G
      G
      G
      G

      OdedDvirO מנותק
      OdedDvirO מנותק
      OdedDvir
      כתב ב נערך לאחרונה על ידי
      #2

      @מנצפך אני הייתי לוקח כמה מילים ובודק האם הן קיימות במילון. הבדיקה יחסית מהירה ותיתן לך אינדקציה טובה עם התחשבות בטעויות כתיב או הקלדה.
      צריך רק לתת את הדעת לאותיות שימוש תחיליות וסופיות (אם הן קיימות כבר במילון זה הכי טוב)

      מנצפךמ תגובה 1 תגובה אחרונה
      5
      • OdedDvirO OdedDvir

        @מנצפך אני הייתי לוקח כמה מילים ובודק האם הן קיימות במילון. הבדיקה יחסית מהירה ותיתן לך אינדקציה טובה עם התחשבות בטעויות כתיב או הקלדה.
        צריך רק לתת את הדעת לאותיות שימוש תחיליות וסופיות (אם הן קיימות כבר במילון זה הכי טוב)

        מנצפךמ מנותק
        מנצפךמ מנותק
        מנצפך
        כתב ב נערך לאחרונה על ידי
        #3

        מדובר JS בצד לקוח. איזה מילון זמין לי?
        צריך תמיכה באידיש ובעברית.
        אני רוצה להתבסס על מבנה של מילה, ללא בחינה האם היא קיימת במילון.
        מילה כמו "חךגכג" תיפסל בגלל שיש ך באמצע מילה.
        מילה כמו גדכ, תיפסל בגלל תו לא חוקי באמצע מילה. וכמו כן שנגמרת בתו לא תקין. (באידיש יש מילים שמסתיימות במנצפכ לא סופיות?)

        מילה כמו כעג[ד תיפסל בגלל תו לא תקין באמצע מילה.

        בנוסף, אני מנסה לבדוק כיוון של מציאת רצפי אותיות שאינן אופייניות לשפה.

        כמו כן מילה ארוכה מידי תהווה שגיאה.

        משתמש שירצה להספים, יצטרך להתאמץ מעט בשביל לכתוב תגובת ספאם.

        כמובן שאפשר לשחק עם זה הרבה, שלא יפסול על כל שגיאה, אלא רק בכמות מסויימת של שגיאות.

        בשורה התחתונה, אני מנסה למצוא כמה כללים שיבדקו רק על פי צורת המילה, וללא בדיקה מול מילון.

        chagoldC תגובה 1 תגובה אחרונה
        1
        • מנצפךמ מנצפך

          מדובר JS בצד לקוח. איזה מילון זמין לי?
          צריך תמיכה באידיש ובעברית.
          אני רוצה להתבסס על מבנה של מילה, ללא בחינה האם היא קיימת במילון.
          מילה כמו "חךגכג" תיפסל בגלל שיש ך באמצע מילה.
          מילה כמו גדכ, תיפסל בגלל תו לא חוקי באמצע מילה. וכמו כן שנגמרת בתו לא תקין. (באידיש יש מילים שמסתיימות במנצפכ לא סופיות?)

          מילה כמו כעג[ד תיפסל בגלל תו לא תקין באמצע מילה.

          בנוסף, אני מנסה לבדוק כיוון של מציאת רצפי אותיות שאינן אופייניות לשפה.

          כמו כן מילה ארוכה מידי תהווה שגיאה.

          משתמש שירצה להספים, יצטרך להתאמץ מעט בשביל לכתוב תגובת ספאם.

          כמובן שאפשר לשחק עם זה הרבה, שלא יפסול על כל שגיאה, אלא רק בכמות מסויימת של שגיאות.

          בשורה התחתונה, אני מנסה למצוא כמה כללים שיבדקו רק על פי צורת המילה, וללא בדיקה מול מילון.

          chagoldC מנותק
          chagoldC מנותק
          chagold
          כתב ב נערך לאחרונה על ידי
          #4

          @מנצפך אמר בFake text detection:

          איזה מילון זמין לי

          תנ"ך יספיק?

          מנצפךמ nigunN 2 תגובות תגובה אחרונה
          0
          • chagoldC chagold

            @מנצפך אמר בFake text detection:

            איזה מילון זמין לי

            תנ"ך יספיק?

            מנצפךמ מנותק
            מנצפךמ מנותק
            מנצפך
            כתב ב נערך לאחרונה על ידי
            #5

            ממש לא.
            אני גם לא רוצה להכביד בצד לקוח.
            בכל אופן, הסברתי שהכוונה לעשות אלגוריתם שמזהה פחות או יותר הקלדות אקראיות.

            OdedDvirO תגובה 1 תגובה אחרונה
            0
            • chagoldC chagold

              @מנצפך אמר בFake text detection:

              איזה מילון זמין לי

              תנ"ך יספיק?

              nigunN מנותק
              nigunN מנותק
              nigun
              כתב ב נערך לאחרונה על ידי
              #6

              @chagold
              תעבור על המילים בשרשור הזה ותמצא הרבה מילים שלא מופיעות בתנ"ך.

              מייל: nigun@duck.com

              תגובה 1 תגובה אחרונה
              0
              • מנצפךמ מנצפך

                ממש לא.
                אני גם לא רוצה להכביד בצד לקוח.
                בכל אופן, הסברתי שהכוונה לעשות אלגוריתם שמזהה פחות או יותר הקלדות אקראיות.

                OdedDvirO מנותק
                OdedDvirO מנותק
                OdedDvir
                כתב ב נערך לאחרונה על ידי OdedDvir
                #7

                @מנצפך אמר בFake text detection:

                אני גם לא רוצה להכביד בצד לקוח.
                בכל אופן, הסברתי שהכוונה לעשות אלגוריתם שמזהה פחות או יותר הקלדות אקראיות.

                האלגוריתם שאתה מחפש לבדיקה של מילים תקינות דורש תכנון רב, והוא אינו טריוויאלי כלל וכלל.
                אני עדיין מציע לך את האפשרות של המילון, מבחינת יעילות ומבחינת זמן עבודה.
                לגבי המילון עצמו, בעברית יש כאן פרוייקט שאוסף את כל המילים העבריות מויקיפדיה.
                ביידיש תוכל לסרוק כמה טקסטים או אולי את הפורום שלך.

                nigunN תגובה 1 תגובה אחרונה
                0
                • OdedDvirO OdedDvir

                  @מנצפך אמר בFake text detection:

                  אני גם לא רוצה להכביד בצד לקוח.
                  בכל אופן, הסברתי שהכוונה לעשות אלגוריתם שמזהה פחות או יותר הקלדות אקראיות.

                  האלגוריתם שאתה מחפש לבדיקה של מילים תקינות דורש תכנון רב, והוא אינו טריוויאלי כלל וכלל.
                  אני עדיין מציע לך את האפשרות של המילון, מבחינת יעילות ומבחינת זמן עבודה.
                  לגבי המילון עצמו, בעברית יש כאן פרוייקט שאוסף את כל המילים העבריות מויקיפדיה.
                  ביידיש תוכל לסרוק כמה טקסטים או אולי את הפורום שלך.

                  nigunN מנותק
                  nigunN מנותק
                  nigun
                  כתב ב נערך לאחרונה על ידי nigun
                  #8

                  @odeddvir
                  איפה המילון הזה ישב?
                  נראה שמדובר בהרבה כוח עיבוד (או בצד שרת או בצד לקוח)
                  כי הוא יצטרך לחפש כל מילה במילון.
                  ולגבי יידיש כמה טקסטים ממש לא מספיקים לייצור מילון
                  צריך משהו בסדר גודל של ויקיפדיה.

                  נראה ש@מנצפך לא מחפש משהו מושלם
                  רק משהו שיגן מהקלדות רנדומליות של ילדים (למשהו בסגנון של ההודעות בנדרים פלוס).
                  לכן נראה שאפשר להתחיל עם כמה כללים פשוטים שהובאו למעלה
                  ולעבור על ההודעות שעקפו את הסינון ולהוסיף עוד כלל, וכן הלאה.

                  מייל: nigun@duck.com

                  OdedDvirO תגובה 1 תגובה אחרונה
                  2
                  • nigunN nigun

                    @odeddvir
                    איפה המילון הזה ישב?
                    נראה שמדובר בהרבה כוח עיבוד (או בצד שרת או בצד לקוח)
                    כי הוא יצטרך לחפש כל מילה במילון.
                    ולגבי יידיש כמה טקסטים ממש לא מספיקים לייצור מילון
                    צריך משהו בסדר גודל של ויקיפדיה.

                    נראה ש@מנצפך לא מחפש משהו מושלם
                    רק משהו שיגן מהקלדות רנדומליות של ילדים (למשהו בסגנון של ההודעות בנדרים פלוס).
                    לכן נראה שאפשר להתחיל עם כמה כללים פשוטים שהובאו למעלה
                    ולעבור על ההודעות שעקפו את הסינון ולהוסיף עוד כלל, וכן הלאה.

                    OdedDvirO מנותק
                    OdedDvirO מנותק
                    OdedDvir
                    כתב ב נערך לאחרונה על ידי
                    #9

                    @nigun אמר בFake text detection:

                    איפה המילון הזה ישב?

                    בשרת כמובן.

                    נראה שמדובר בהרבה כוח עיבוד (או בצד שרת או בצד לקוח)
                    כי הוא יצטרך לחפש כל מילה במילון.

                    לא צריך לחפש כל מילה, מספיק מדגם של כמה מילים.
                    החיפוש עצמו מהיר מאוד. הרבה יותר מכל אלגוריתם אחר.

                    ולגבי יידיש כמה טקסטים ממש לא מספיקים לייצור מילון
                    צריך משהו בסדר גודל של ויקיפדיה.

                    בזה אני לא יכול לעזור...

                    תגובה 1 תגובה אחרונה
                    0
                    תגובה
                    • תגובה כנושא
                    התחברו כדי לפרסם תגובה
                    • מהישן לחדש
                    • מהחדש לישן
                    • הכי הרבה הצבעות


                    בא תתחבר לדף היומי!
                    • התחברות

                    • אין לך חשבון עדיין? הרשמה

                    • התחברו או הירשמו כדי לחפש.
                    • פוסט ראשון
                      פוסט אחרון
                    0
                    • דף הבית
                    • קטגוריות
                    • פוסטים אחרונים
                    • משתמשים
                    • חיפוש
                    • חוקי הפורום