דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תוכנה
  3. שליפת כל המשפטים בעברית מתוך קובץ PHP

שליפת כל המשפטים בעברית מתוך קובץ PHP

מתוזמן נעוץ נעול הועבר תוכנה
28 פוסטים 6 כותבים 708 צפיות 4 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • dovidD מנותק
    dovidD מנותק
    dovid
    ניהול
    כתב ב נערך לאחרונה על ידי dovid
    #14

    אפשר לכתוב א-ת בלי להבין הרבה באקסדצימלית, ושים לב לסמן למטה Regular Expression
    5883c119-c53a-424e-9894-267b926a8ad9-image.png

    • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
    • בכל נושא אפשר ליצור קשר dovid@tchumim.com
    תגובה 1 תגובה אחרונה
    4
    • yossizY yossiz

      @nigun אמר בשליפת כל השפטים בעברית מתוך קובץ PHP:

      אני מנסה לכתוב בnotepad++
      /[\x{0590}-\x{05FF}]+/u

      וזה לא עובד

      כי זה לא regex תקין. (ה-/ בהתחלה וסוף הוא לא חלק משפת regex אלא שפת PHP, הכפילות של ה-\\ גם נצרך רק ב-PHP, ה-u בסוף הוא דגל שגם לא חלק מה-regex)
      זה 👇 תקין, אם כי יכול להיות שזה לא יעשה בדיוק מה שאתה רוצה...

      [\x{0590}-\x{05FF} ]+
      
      nigunN מנותק
      nigunN מנותק
      nigun
      כתב ב נערך לאחרונה על ידי nigun
      #15

      @yossiz אמר בשליפת כל השפטים בעברית מתוך קובץ PHP:
      עושה בדיוק מה שאני רוצה
      (דהיינו מוצא משפטים שלמים)
      אבל אני רוצה משהו כמו סקריפט שיוציא לי באופן מסודר את הכל
      ניסיתי לכתוב משהו בפייתון אבל הסתבכתי עם הקידוד
      האם זה הכיוון?

      import re
      
      string = unicode('אבגד', 'utf-8')
      pattern = '[\x{0590}-\x{05FF} ]+'
      result = re.findall(pattern, string) 
      
      print(result)
      

      מייל: nigun@duck.com

      תגובה 1 תגובה אחרונה
      0
      • yossizY מנותק
        yossizY מנותק
        yossiz
        כתב ב נערך לאחרונה על ידי yossiz
        #16

        @nigun אמר בשליפת כל השפטים בעברית מתוך קובץ PHP:

        עושה בדיוק מה שאני רוצה

        מקווה שזה נכון למרות שלא נראה לי...
        לדוגמה:
        dcf333a6-23a0-43ce-980f-9ceb3fb68c97-image.png

        אבל אני רוצה משהו כמו סקריפט שיוציא לי באופן מסודר את הכל

        עדיין אין צורך בסקריפט, אפשר ב-vscode כך:

        • ctrl+f [א-ת ]+
        • ctrl+shift+l (בוחר כל המופעים)
        • ctrl+c
        • ctrl+n
        • ctrl+v

        ניסיתי לכתוב משהו בפייתון אבל הסתבכתי עם הקידוד

        import re
         
        string = u'\u05d0\u05d1\u05d2\u05d3 abc \u05d4\u05d5\u05d6\u05d7' # 'אבגד abc הוזח'
        pattern = u'[\u05d0-\u05ea ]+' # '[א-ת ]+'
        result = re.findall(pattern, string) 
         
        print(result)
        

        📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

        nigunN תגובה 1 תגובה אחרונה
        1
        • yossizY yossiz

          @nigun אמר בשליפת כל השפטים בעברית מתוך קובץ PHP:

          עושה בדיוק מה שאני רוצה

          מקווה שזה נכון למרות שלא נראה לי...
          לדוגמה:
          dcf333a6-23a0-43ce-980f-9ceb3fb68c97-image.png

          אבל אני רוצה משהו כמו סקריפט שיוציא לי באופן מסודר את הכל

          עדיין אין צורך בסקריפט, אפשר ב-vscode כך:

          • ctrl+f [א-ת ]+
          • ctrl+shift+l (בוחר כל המופעים)
          • ctrl+c
          • ctrl+n
          • ctrl+v

          ניסיתי לכתוב משהו בפייתון אבל הסתבכתי עם הקידוד

          import re
           
          string = u'\u05d0\u05d1\u05d2\u05d3 abc \u05d4\u05d5\u05d6\u05d7' # 'אבגד abc הוזח'
          pattern = u'[\u05d0-\u05ea ]+' # '[א-ת ]+'
          result = re.findall(pattern, string) 
           
          print(result)
          
          nigunN מנותק
          nigunN מנותק
          nigun
          כתב ב נערך לאחרונה על ידי nigun
          #17

          @yossiz
          מצויין
          עכשיו איך אני מסנן את כל הרווחים שהם לא בין מילים בעברית
          עריכה: שמתי הכל באקסל ומיינתי מהגדול לקטן
          אבל אולי יש דרך יותר חכמה

          מייל: nigun@duck.com

          yossizY תגובה 1 תגובה אחרונה
          0
          • nigunN nigun

            @yossiz
            מצויין
            עכשיו איך אני מסנן את כל הרווחים שהם לא בין מילים בעברית
            עריכה: שמתי הכל באקסל ומיינתי מהגדול לקטן
            אבל אולי יש דרך יותר חכמה

            yossizY מנותק
            yossizY מנותק
            yossiz
            כתב ב נערך לאחרונה על ידי
            #18

            @nigun האם המחרוזות ממוסגרות על ידי גרש או גרשיים?
            אם כן, חפש:

            [\'\"].*[א-ת].*[\'\"]
            

            📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

            nigunN תגובה 1 תגובה אחרונה
            2
            • yossizY yossiz

              @nigun האם המחרוזות ממוסגרות על ידי גרש או גרשיים?
              אם כן, חפש:

              [\'\"].*[א-ת].*[\'\"]
              
              nigunN מנותק
              nigunN מנותק
              nigun
              כתב ב נערך לאחרונה על ידי
              #19

              @yossiz
              אני רואה שזה נושא ששווה ללמוד קצת יותר לעומק
              מצאתי את זה
              האם אתה ממליץ על זה או שעדיף להתחיל עם משהו יותר פשוט?

              מייל: nigun@duck.com

              yossizY תגובה 1 תגובה אחרונה
              0
              • nigunN nigun

                @yossiz
                אני רואה שזה נושא ששווה ללמוד קצת יותר לעומק
                מצאתי את זה
                האם אתה ממליץ על זה או שעדיף להתחיל עם משהו יותר פשוט?

                yossizY מנותק
                yossizY מנותק
                yossiz
                כתב ב נערך לאחרונה על ידי yossiz
                #20

                @nigun אם אתה לא מכיר את הנושא ודאי שווה ללמוד אותו

                דרך אגב, ה-regex שכתבתי למעלה לא טוב 😞 (כי הוא "רעבתני" מדי...)
                ניסיתי כך:

                ['"].*?[א-ת].*?['"]
                

                ועדיין לא עובד. אני לא מבין למה.
                ה-? אמור למגר את ה"רעבתנות". אבל הוא לא...
                bc151a88-623d-45cb-a372-956ac7319cce-image.png
                אולי @dovid יכול לשפוך אור על הנושא.
                עריכה: הבנתי למה לא עובד. אבל עדיין לא יודע איך כן אפשר לכתוב אותו
                עריכה2: זה עובד:

                ['"][^"']*[א-ת][^"']*['"]
                

                למעשה זה עדיין נכשל במקרים מסויימים אבל נראה לי שלטפל בזה מגרד את גבולות היכולת של regex-ים.

                @nigun אמר בשליפת כל השפטים בעברית מתוך קובץ PHP:

                או שעדיף להתחיל עם משהו יותר פשוט

                לא נראה לי, זה לא נושא כל כך ענקי.

                כאן יש אתר כיפי להתאמן

                📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                nigunN תגובה 1 תגובה אחרונה
                2
                • שואףש מנותק
                  שואףש מנותק
                  שואף
                  כתב ב נערך לאחרונה על ידי
                  #21

                  בדיוק לפני שבוע בניתי פונקציה (אסטריסק) שתשלוף את כל המשפטים בעברית, ושלוחה להקלטת כל המשפטים האלה לקריינות אנושית.
                  מכיוון שהיו גם טקסטים בעברית שלא צריכים קריינות (לדוגמא טקסט שנשלח במייל), אז ההגדרה היא שמה שמוקף במרכאות נקלט, ומה שבמרכאות כפולות לא.

                  		preg_match_all("#'(\p{Hebrew}.*)'#uisU", file_get_contents($script), $m);
                  

                  ליצירת קשר: admin@i-call.me

                  הידד! גישה למייל גם בלי מחשב ואינטרנט!

                  תגובה 1 תגובה אחרונה
                  2
                  • dovidD מנותק
                    dovidD מנותק
                    dovid
                    ניהול
                    כתב ב נערך לאחרונה על ידי
                    #22
                    ["']([,.:?א-ת]+\s*)*["']
                    
                    • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                    • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                    תגובה 1 תגובה אחרונה
                    0
                    • שואףש מנותק
                      שואףש מנותק
                      שואף
                      כתב ב נערך לאחרונה על ידי
                      #23

                      לא זוכר בדיוק, אבל הPHP לא מקבל תווים בעברית בREGEX.
                      גם אני עשיתי ככה בהתחלה ולא קיבל

                      ליצירת קשר: admin@i-call.me

                      הידד! גישה למייל גם בלי מחשב ואינטרנט!

                      dovidD תגובה 1 תגובה אחרונה
                      0
                      • שואףש שואף

                        לא זוכר בדיוק, אבל הPHP לא מקבל תווים בעברית בREGEX.
                        גם אני עשיתי ככה בהתחלה ולא קיבל

                        dovidD מנותק
                        dovidD מנותק
                        dovid
                        ניהול
                        כתב ב נערך לאחרונה על ידי
                        #24

                        @שואף לא דיברתי על php.

                        • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                        • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                        תגובה 1 תגובה אחרונה
                        0
                        • yossizY yossiz

                          @nigun אם אתה לא מכיר את הנושא ודאי שווה ללמוד אותו

                          דרך אגב, ה-regex שכתבתי למעלה לא טוב 😞 (כי הוא "רעבתני" מדי...)
                          ניסיתי כך:

                          ['"].*?[א-ת].*?['"]
                          

                          ועדיין לא עובד. אני לא מבין למה.
                          ה-? אמור למגר את ה"רעבתנות". אבל הוא לא...
                          bc151a88-623d-45cb-a372-956ac7319cce-image.png
                          אולי @dovid יכול לשפוך אור על הנושא.
                          עריכה: הבנתי למה לא עובד. אבל עדיין לא יודע איך כן אפשר לכתוב אותו
                          עריכה2: זה עובד:

                          ['"][^"']*[א-ת][^"']*['"]
                          

                          למעשה זה עדיין נכשל במקרים מסויימים אבל נראה לי שלטפל בזה מגרד את גבולות היכולת של regex-ים.

                          @nigun אמר בשליפת כל השפטים בעברית מתוך קובץ PHP:

                          או שעדיף להתחיל עם משהו יותר פשוט

                          לא נראה לי, זה לא נושא כל כך ענקי.

                          כאן יש אתר כיפי להתאמן

                          nigunN מנותק
                          nigunN מנותק
                          nigun
                          כתב ב נערך לאחרונה על ידי
                          #25

                          @yossiz
                          המדריך ההוא משתמש באתר הזה
                          ונראה לי שהוא נותן אופציות יותר מתקדמות

                          מייל: nigun@duck.com

                          תגובה 1 תגובה אחרונה
                          0
                          • ח מנותק
                            ח מנותק
                            חוקר
                            כתב ב נערך לאחרונה על ידי
                            #26

                            @yossiz אמר בשליפת כל המשפטים בעברית מתוך קובץ PHP:

                            עדיין אין צורך בסקריפט, אפשר ב-vscode כך:

                            ctrl+f [א-ת ]+
                            ctrl+shift+l (בוחר כל המופעים)
                            ctrl+c
                            ctrl+n
                            ctrl+v

                            בPHPSTORM אני לא מצליח לבחור את כל המופעים, יש למישהו מידע איך ניתן לעשות את זה שם?

                            nigunN תגובה 1 תגובה אחרונה
                            0
                            • ח חוקר

                              @yossiz אמר בשליפת כל המשפטים בעברית מתוך קובץ PHP:

                              עדיין אין צורך בסקריפט, אפשר ב-vscode כך:

                              ctrl+f [א-ת ]+
                              ctrl+shift+l (בוחר כל המופעים)
                              ctrl+c
                              ctrl+n
                              ctrl+v

                              בPHPSTORM אני לא מצליח לבחור את כל המופעים, יש למישהו מידע איך ניתן לעשות את זה שם?

                              nigunN מנותק
                              nigunN מנותק
                              nigun
                              כתב ב נערך לאחרונה על ידי
                              #27

                              @חוקר
                              אולי Ctrl+Alt+Shift+J
                              ככה הבנתי מכאן

                              מייל: nigun@duck.com

                              תגובה 1 תגובה אחרונה
                              1
                              • ח מנותק
                                ח מנותק
                                חוקר
                                כתב ב נערך לאחרונה על ידי
                                #28

                                @nigun אמר בשליפת כל המשפטים בעברית מתוך קובץ PHP:

                                אולי Ctrl+Alt+Shift+J

                                עובד!

                                תגובה 1 תגובה אחרונה
                                0
                                תגובה
                                • תגובה כנושא
                                התחברו כדי לפרסם תגובה
                                • מהישן לחדש
                                • מהחדש לישן
                                • הכי הרבה הצבעות


                                • 1
                                • 2
                                בא תתחבר לדף היומי!
                                • התחברות

                                • אין לך חשבון עדיין? הרשמה

                                • התחברו או הירשמו כדי לחפש.
                                • פוסט ראשון
                                  פוסט אחרון
                                0
                                • דף הבית
                                • קטגוריות
                                • פוסטים אחרונים
                                • משתמשים
                                • חיפוש
                                • חוקי הפורום