קטגוריות משנה

    שלום לכולם
    התבקשתי רבות מחברים פיתרון לבעיה הידועה לבצע מיזוג דואר, אך לשמור קובץ PDF נפרד לכל רשומה, עם שם מותאם אישית.

    אפרט כאן במדריך שלב אחר שלב איך לבצע זאת, תהיו איתי עד הסוף מקווה שתהנו...


    שלב א:

    ראשית בקובץ ה- Excel של רשימת הנמענים, הוסיפו לטבלת הנתונים ארבעה עמודות בשמות כדלהלן (חשוב שהשמות יהיו מדויקים ללא רווחים מיותרים - לתשומת ליבכם):





    שלב ב:
    צרו שתי תיקיות נפרדות, אחד לקבצי הפלט בפורמט docx, ואחד לקבצי הקלט בפורמט pdf, העתיקו את נתיב התיקייה של קבצי ה- docx והדביקו אותם עבור כל רשומה בשדה שיצרתם בשם DocFolderPath, לאחמ"כ חזרו על הפעולה והפעם העתיקו את נתיב התיקייה של קובצי ה- PDF והדביקו בשדה PdfFolderPath.
    בשדה DocFileName כתבו את השם של הקובץ עבור הרשומה - ניתן להשתמש בנוסחאות, כמו"כ בשדה PdfFileName כתבו את שם הקובץ כנ"ל.

    שלב ג:
    פתחו את קובץ ה- word והשלימו את פעולת המיזוג כרגיל, עצבו את המסמך כרצונכם.

    שלב ד:
    פתחו את לשונית מפתחים בקובץ ה- word פתחו את עורך הקוד הוסיפו מודל חדש מצו"ב צילום מסך:

    הדביקו את הקוד הבא:

    Sub MailMergeToPdfBasic() ' Mark the start of the Subroutine (i.e. Macro) and name it "MailMergeToPdf" ' Macro created by Imnoss Ltd ' Please share freely while retaining attribution ' Last Updated 2021-05-03 Dim masterDoc As Document, singleDoc As Document, lastRecordNum As Long ' Create variables ("Post-it Notes") for later use Set masterDoc = ActiveDocument ' Identify the ActiveDocument (foremost doc when Macro run) as "masterDoc" masterDoc.MailMerge.DataSource.ActiveRecord = wdLastRecord ' jump to the last active record (active = ticked in edit recipients) lastRecordNum = masterDoc.MailMerge.DataSource.ActiveRecord ' retrieve the record number of the last active record so we know when to stop masterDoc.MailMerge.DataSource.ActiveRecord = wdFirstRecord ' jump to the first active record (active = ticked in edit recipients) Do While lastRecordNum > 0 ' create a loop, lastRecordNum is used to end the loop by setting to zero (see below) masterDoc.MailMerge.Destination = wdSendToNewDocument ' Identify that we are creating a word docx (and no e.g. an email) masterDoc.MailMerge.DataSource.FirstRecord = masterDoc.MailMerge.DataSource.ActiveRecord ' Limit the selection to just one document by setting the start ... masterDoc.MailMerge.DataSource.LastRecord = masterDoc.MailMerge.DataSource.ActiveRecord ' ... and end points to the active record masterDoc.MailMerge.Execute False ' run the MailMerge based on the above settings (i.e. for one record) Set singleDoc = ActiveDocument ' Identify the ActiveDocument (foremost doc after running the MailMerge) as "singleDoc" singleDoc.SaveAs2 _ FileName:=masterDoc.MailMerge.DataSource.DataFields("DocFolderPath").Value & Application.PathSeparator & _ masterDoc.MailMerge.DataSource.DataFields("DocFileName").Value & ".docx", _ FileFormat:=wdFormatXMLDocument ' Save "singleDoc" as a word docx with the details provided in the DocFolderPath and DocFileName fields in the MailMerge data singleDoc.ExportAsFixedFormat _ OutputFileName:=masterDoc.MailMerge.DataSource.DataFields("PdfFolderPath").Value & Application.PathSeparator & _ masterDoc.MailMerge.DataSource.DataFields("PdfFileName").Value & ".pdf", _ ExportFormat:=wdExportFormatPDF ' Export "singleDoc" as a PDF with the details provided in the PdfFolderPath and PdfFileName fields in the MailMerge data singleDoc.Close False ' Close "singleDoc", the variable "singleDoc" can now be used for the next record when created If masterDoc.MailMerge.DataSource.ActiveRecord >= lastRecordNum Then ' test if we have just created a document for the last record lastRecordNum = 0 ' if so we set lastRecordNum to zero to indicate that the loop should end Else masterDoc.MailMerge.DataSource.ActiveRecord = wdNextRecord ' otherwise go to the next active record End If Loop ' loop back to the Do start End Sub ' Mark the end of the Subroutine

    שלב ה וסיום:
    סגרו את עורך הקוד.
    לחצו על כפתור פקודות מאקרו שבכרטיסיית מפתחים, בחרו את המאקרו בשם MailMergeToPdfBasic ולחצו הפעל מצו"ב צילום מסך

    כעת שבו בנחת והמתינו עד ליצירת כל הקבצים, להנאתכם תפתחו את תיקיות הפלט שיצרתם וגלו שהיא מלאה קבצים קובץ לכל רשומה בשם המתאים שהגדרתם לה.


    @אבי אמר בשוב, צילומי הצ'קים בבנקים:

    התעסקתי לאחרונה עם סורקים של חברת MAGTEK, הם ידידותיים ונוחים להתממשקות, אבל כמדומני שהבנקים בישראל מוכנים לקבל סריקות רק מסורקים של חברת PANINI

    @אבי איך יוצרים אתך קשר?

    יש כמה נוסחאות חדשות שממש משנות את כללי המשחק בגוגל שיטס:

    CHOOSECOLS לבחירת עמודות ממערך CHOOSEROWS לבחירת שורות ממערך WRAPROWS להמרת מערך חד ממדי לרב ממדי - פריסה לשורות WRAPCOLS כנ"ל - פריסה לעמודות HSTACK ו VSTACK - הפעולה של {} אך בלי סוגריים - לא משמעותי לכאורה

    והעולה על כולנה, סוף סוף:

    LET - ליצירת משתנים.

    כל אלו מצטרפות לפונקציות שנוספו מוקדם יותר -

    וכלול בתוכם - LAMBDA, MAP (חלקי - לא עובד לקנן ב MAP ודומיו מערכים אחרים), פונקציות בעלות שם, וכו' ע"ש בקישור.

    @ארי כתב במספר עשרוני בVBA:

    @yossiz גאונות!

    אתה טועה, זו לא גאונות.
    זה לא איזה הוקוס פוקוס שהפיכת הלוכסן פותרת באגים,
    זה פשוט שני אופרטורים שונים בVBA:
    / - הלוכסן הרגיל של החילוק ושל נתיבי קבצים בשורת הכתובת באינטרנט,
    הינה חילוק רגיל. 10 / 3 = 3.3333333333333
    \ - זה נקרא לוכסן הפוך, זה הלוכסן המשמש בנתיבי הקבצים בWindows, ובזה השתמש בהתחלה
    הפעולה שהלכוסן הזה עושה היא חילוק שלמים, 10 \ 3 = 3. זה מאוד כיף, וכשעוברים לשפה אחרת שאין את זה אז בהתחלה עושים פרצופים חמוצים.


    א. לפחות עבורי זה יותר ממחיש
    ב. יש לי טראומות לפעמים כשאני מבקר בקוד המקור.
    (עריכה: בקשר לILSpy הGo To Definition בינתיים מוליך אליו, ולא עשו עוד קיצור כזה ישר לגיטאב).

    @לעזור-לכולם אתה צודק, אבל בגלל שזה לא רלוונטי לכל חברה ולכל חבילה של החברה, מיקדתי את השאלה למצב נתון בו אני מתלבט בין שני שרתים בלבד

    @dovid כתב בהאם יש אפשרות לתכנת ישירות בענן:

    בעצם אף אחד לא הציע את העבודה לוקלית מול DOCKER או SSH מרוחק.


    לגבי נושא ה "שירותים נפרדים" זה עניין סמנטי,
    וכמו שאמרת בתגובה הקודמת יש restart policy שאפשר להגדיר לפי הצורך

    אתה שואל כנראה על הגבלת UNIQUE (בלע״ז CONSTRAINT)? אם כן, זה מכריח את ה-DB ליצור אינדקס. אין צורך להוסיף שוב אינדקס.
    זה עוזר כמובן למצוא את השורה ולא העמודה

    @צדיק-תמים חגי לא המליץ ישירות על התוסף הזה אלא על ההוא של הmssql.
    את התוסף הזה @חגי הביא בתשובה לשאלה "האם יש גם תוספים לMYSQL".
    אבל אני מסכים שהביקורות לא אומרות כלום ואפילו אם הם היו עדכניות.
    את הדירוג הנמוך (שגם לא אומר הרבה בפלטפורמה הזו) ואת מס' ההתקנות הנמוך יחסית אפשר להסביר בגלל שזה בכסף.

    @צדיק-תמים כתב באשמח לעזרה בקוד פייתון:

    הפקודה שהבאת נראית הגיונית, תנסה אולי לסגור את חלון הטרמינל ולפתוח אותו מחדש

    ניסיתי גם להריץ כמנהל וזה עדיין לא עובד

    requests.exceptions.SSLError: HTTPSConnectionPool(host='www.digitalwhisper.co.il', port=443): Max retries exceeded with url: /files/Zines/0x08/DigitalWhisper8.pdf (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:997)')))
    @dovid לא ציפיתי לכזו תגובה חריפה
    נכון שעשיתי 'קונצים' בעבר, אבל אולי חזרתי בתשובה?
    אני מבחינתי פותח דף חדש.

    למעשה, לבעיה שלי מצאתי פתרון הדפסה ישירות מהhtml עם תצוגה מקדימה שנראית ככה:

    אם אי פעם יהיה למישהו צורך בקוד (או למקרה שיש צורך דחוף להדפיס את הדף הזה דרך Pyqt6 דווקא...):

    import sys from PyQt6.QtCore import QCoreApplication, QUrl, pyqtSlot, QEventLoop from PyQt6.QtPrintSupport import QPrintPreviewDialog, QPrinter from PyQt6.QtWebEngineWidgets import QWebEngineView from PyQt6.QtWidgets import QApplication class PDFPage(QWebEngineView): def __init__(self, url, filename): super(PDFPage, self).__init__() self.url = QUrl.fromUserInput(url) self.filename = filename self.loadFinished.connect(self.load_finished) self.m_printer = QPrinter(QPrinter.PrinterMode.HighResolution) self.m_waitForResult = QEventLoop() self.printFinished.connect(self.print_finished) def start(self): self.load(self.url) def load_finished(self, ok): if ok: self.QPrintPreviewDialog = QPrintPreviewDialog(self.m_printer) self.QPrintPreviewDialog.paintRequested.connect(self.printDocument) self.QPrintPreviewDialog.exec() else: QCoreApplication.exit(-1) def printDocument(self, printer): self.print(printer) self.m_waitForResult.exec() def print_finished(self): self.m_waitForResult.quit() def pdf_from_url(url, filename): app = QApplication(sys.argv) page = PDFPage(url, filename) page.start() ret = app.exec() return ret == 0 sucess = pdf_from_url("https://tchumim.com/topic/13945/%D7%94%D7%93%D7%A4%D7%A1%D7%AA-%D7%A7%D7%95%D7%91%D7%A5-pdf-%D7%91%D7%A4%D7%99%D7%99%D7%AA%D7%95%D7%9F-windows/13?_=1662075589691", "test.pdf") if sucess: print("PDF has been generated")

    לגופו של עניין, כנראה שהתשובה תהיה באמת להמיר את הpdf לתמונה באמצעות pdf2image ואחר כך להדפיס באמצעות win32print. דוגמא מובאת למעלה בקישור שבהודעה הראשונה שלי.

    תודה לכל העוזרים ובפרט ל @yossiz המיוחד...

    @מומחה-באקסס צור קשר באישי
    מקווה שאוכל לעזור

    גם השאלה וגם התשובות לא מספיק הבחינו בין מקרים.
    אתה דיברת בשאלה ובהבהרות ההמשך שלה על כמה מקרים:

    שדות כפולים לחיסכון JOIN, כלומר האם לגיטימי לשמור עותק של נתון בטבלה א' כדי להימנע מJOIN על כל צעד ושעל לטבלה ב'. שדות רבים של אותה ישות (קשר יחיד ליחיד) שתמיד בשימוש, ומתעורר צורך בפיצול רק בגלל גודלה של הטבלה, או בגלל הבדל מהותי במהות הפרטים הללו. כנ"ל, אבל שלא קיימים עבור כל ישות. למשל פרטי חשבון בנק, שלכל המשלמים באשראי יש בכלל פרטי אשראי. אז ישנם פרטי בנק ואשראי בקשר יחיד ליחיד לטבלת האנשים (יש מצב נדיר שיש שני ח-ן לאדם ולהיפך, אבל אני מתעלם מכך כעת). שדות דינמיים, כלומר שגם אחרי שהמוצר יהיה מושלם, יהיה צורך בשינויים (עריכה/הוספה/מחיקה של שדות) כשגרת השימוש במערכת. 1. מידע כפול לחיסכון בJOIN

    לא לגיטימי כלל במסד נתונים רלציוני, ובשביל ביצועים יש לשנות מהלגיטימציה רק במקרי קיצון.

    2. פיצול טבלה מרובת שדות לשני טבלאות עם קשר יחיד ליחיד

    יש לעיתים הגיון בפיצול טבלה לשניים למרות שהשדות תמיד בשימוש ותמיד קשר של יחיד ליחיד. למשל אם אתה נוהג להשתמש ב* בחלק מהשאילתות שלך, שדות רבים שלא בשימוש שגרתי הם מכבידים על תוצאות השאילתה. כמו כן זה מיקל קצת על הבנת השדות, כי אפשר לקרוא להם בשמות קצרים יותר ("סניף" בטבת חשבונות בנק, יותר קל מאשר "סניף חשבון" וכדומה בטבלת האנשים).
    עצם העובדה שיש כבר 150 שדות בטבלה זה לא עילה לדעתי לפצל טבלה.

    3. פיצול קבוצות של מידע אופציונלי מהטבלה

    בעצם זה אותו מקרה של 2, רק שיש פה שני ייתרונות נוספים אפשריים

    מקום. שדות רבים ריקים תיאורטית לוקחים מקום, ומעשית יש להם עלות ביצועית למסד הנתונים. במקרה כזה הטבלה החדשה היא מה 0..1-1 כלומר לא לכל שורה יש שורה תאומה. מהות - נח בפיתוח ובתחזוקה להבין שקבוצת שדות מסויימת היא נושא מסויים. בדרך כלל זה בעצם ישויות נפרדות. למשל פרטי חשבון בנק זה לא תכונות של אדם אלא ישות שקוראים לה חשבון בנק. המציאות היא שישויות נפרדות יכולות בהמשך להפוך לרבים ליחיד או יחיד לרבים. 4. פיצול טבלה כדי להפריד שדות דינמיים משדות קבועים

    אם התוכנה בנויה באופן שהיא עצמה יכולה להוסיף שדות/תכונות לישות, בהחלט מתבקש להפריד את זה מהטבלה שמחזיקה את נתוני הליבה. כמו"כ בגלל הרבה בעיות וקשיים בתחזוקת כזה דבר, וגם בגלל שעריכת מסד נתונים בזמן ייצור זה לא אמור להיות שגרה ברוכה, לכן מתבקש הפתרון של @clickone שזה EAV.

    תודה לכל המעוררים.

    יש לי קצת סתירה באתר שם, מצד אחד כמו שנאמר לעיל החיוב אמור להיות מקצה התחום של היישוב, ולכן היה אפשר להסביר את ההפרשים שהיו לי.
    מצד שני, אם אני עושה הסעה מביתר לירושלים לדוג' הוא כותב שהם באותו תחום ולכן זה בחינם, אבל בכל זאת יש הבדל במחיר בין הסעה מירושלים לתל אביב או מביתר. ואם הם באותו תחום לכאו' לא אמור להיות הבדל, לא?
    כך שאיך שלא יהיה החישוב שלהם לא ברור לפי מה הוא נעשה.
    דבר נוסף, כמו שכתבתי בהסעה מקריית שמונה לאילת יש הבדל של כ70 ק"מ בין החישובים, ואם מחשבים מקצה התחום ההבדל אמור להיות שלפי החישוב שלה יהיה פחות מרחק מה שלא קרה.
    וזה בלי לדון לפי מה הם מחשבים מרחקים, ודאי לא לפי מרחק אווירי אז לפי איזה כביש הם מחשבנים.

    היוצא מכל הנ"ל, שלכאו' גם אם באמת המגבלה שלהם מחייבת גם לפי ההלכה, מ"מ זה לא על המחיר אלא על אופן החישוב (לפי מרחק ולא לפי מה שבא לי), ואם כך נראה שהחישוב שלהם הוא די מקרי, ולענ"ד החישוב על פי הנתונים של מדינת ישראל הרשמית אמור להיות בסדר גם מבחינת החוק וגם ההלכה להבדיל.

    ודאי שכל זה הוא לפלפול בעלמא, וכשנגיע למעשה אעשה שאלת רב.

    שוב תודה לכל המגיבים.

    מוטי 0מ

    לא מכיר את מה ש @yossiz כתב,
    אם זה API שמיועד לזה, זה הברירה הראשונה.
    אבל אפשר גם עם Puppeteer.
    זה עבד לי יופי בהורדות מאתרים.
    רק שאם יש שינוי קל ב HTML אתה צריך לעדכן מחדש...

    זה אמנם עובד בעיקר עם NODE,
    אבל עשיתי את זה פעם עם PHP,
    הרצתי קונסול ואז ב NODE את הסקריפט המוכן,
    זה עבד לי על הורדת קבצים,
    אבל זה די מורכב.

    @chagold כתב בשכפול מסד נתונים (פעיל):

    (המקורי 3.5 GB והחדש 5.1 GB)

    @dovid כתב בשכפול מסד נתונים (פעיל):

    בכל מקרה הבדל הגודל הוא טבעי ולא אינדיקציה לשום בעיה

    אני לא יודע איפה אתה בודק את הגודל של המקורי מול הישן
    אבל אם זה בphpmyadmin אז יש בחשבון שאם תעשה Optimize table לכל הטבלאות אתה תגלה שגם במקורי הגודל באמת יותר גדול מהמוצג.
    אין לי מושג מה בדיוק עושה Optimize table ואיך זה עובד, אבל מציאות שהמטא נתונים על הטבלה לא מתעדכן כל הזמן בפועל, והגודל האמיתי ניתן לדעת אחרי Optimize table

    @dovid כתב בהפעלת קובץ בJS:

    @WWW גם אם זה פתרון טוב עבורו, במאמץ הזה יש עשרה פתרונות פשוטים בהרבה לבעיה המקורית.

    כתבתי את זה לצורך מי שיחפש את הפתרון לבעיה שבכותרת.

    @dovid תודה 🙂
    באמת אריכות דבריי לא מובנת למי שלא נכנס לתוך ראשי ומבין במה התקישיתי

    התקשיתי גם איך נכנסים המחרוזות הריקות לפלט, וגם כי התבלבלתי איך באמת אמור להיות ההתנהגות כאשר יש התאמה למחרוזת ריקה, למשל אם זה בתחילת הקלט, האם מכניסים את המרוזת הריקה שלפני ההתאמה? האם מתקדמים עוד תו אחרי ההתאמה? ולמה? וכו'
    מכיון שההשראה להסתבכות היו דברי חגי אז כתבתי כל הנ"ל בתשובה לדברי חגי, אבל באמת לא הכל קשור

    @גאון היקר,
    הפוסט שלי נכתב בקטגוריית "תכנות", זו קטגוריה שמיועדת למתכנתים,
    הפוסט שלי כיוון למתכנתים שירצו בעתיד לנתח כזה קובץ ישירות מסיבותהם שלהם, ולא להזדקק לתוכנה באמצע שתמיר את זה לאקסל.

    אכן אם הייתי סתם מעלה קוד / קובץ שראה איך לנתח את הקובץ הזה בגומלין לדוגמא, זה היה מיותר וההערה הצודקת שלך היתה במקומה.

    @NH-LOCAL זה גרם לבעיה גם במחשבים שלא מחוברים לאינטרנט.
    הנה הקוד למי שמתעניין:

