(HTML To String(PDF
-
הנה הקוד המלא
static void Main(string[] args) { WebClient client = new WebClient(); var bytes = client.DownloadData("http://code.613m.org/"); //string htmlCode = System.Text.Encoding.Default.GetString(bytes); // או קידוד אחר string htmlCode = System.Text.Encoding.UTF8.GetString(bytes); var docName = @"c:\myDoc.html"; File.WriteAllText(docName, htmlCode); Word.Application TheWordApp = new Word.Application(); var TheDocument = TheWordApp.Documents.Open(docName); TheDocument.ExportAsFixedFormat( docName.Replace(".html", ".pdf"), Word.WdExportFormat.wdExportFormatPDF, OptimizeFor: Word.WdExportOptimizeFor.wdExportOptimizeForOnScreen, BitmapMissingFonts: true, DocStructureTags: false); ((Word._Document)TheDocument).Close(); }
פורסם במקור בפורום CODE613 ב28/08/2015 16:36 (+03:00)
-
אני דוקא מסכים עם ארכיטקט.
הפלוס בוורד זה הפשטות, המינוסים רבים: ביצועים עצומים, הצורך בתוכנת וורד מותקנת (בשרת זה פשוט טפשי), שמירה מיותרת בדיסק כפולה (אף האחרונה מיותרת למקרה והתוצאה לDB או להחזרה ללקוח).בכל אופן וורד זה עדין אופציה קלה. ואם כבר וורד, אז הWebClient והקידוד מיותרים" וורד יודע לפתוח מסמכי אינטרנט. אם כי שמירה בשם מקדימה נדרשת כי משום מה הוא איננו מוכן לייצא קובץ שאיננו פיזי ונגיש לכתיבה.
פורסם במקור בפורום CODE613 ב30/08/2015 10:51 (+03:00)
-
@Zvi Good
אם הבנתי נכון אז הקישור ששלחת לי הוא מדריך איך לשמור קובץ וורד ל PDF
אבל אני עדיין אוחז לפני
איך אפשר להמיר דף HTML לסטרינג (או סוג אחר) ולשמור על העיצוב שנמצא בדף ה HTML?
כלומר אם יש תגיות </ h2> <br> וכדו' שמדגיש טקסט או מעבר שורה אז שהם ישמרורבי צבי אין מושג כזה "סטרינג מעוצב", פשוט אין, סטרינג זה אוסף תווי יוניקוד שאין להם שום מאפיין עיצובי.
מה שכן, יש תוכנות שיודעות "להציג" סטרינג בצורה מעוצבת. אחת התוכנות נקראת "דפדפן" יש של חברת גוגל (כרום) ויש של חברת מייקרוסופט (אקספלורר) וכן הלאה. התוכנות הללו לוקחות סטריג ומגדילות אותו "על המסך". על מנת לדעת איזה גודל להציג לך, הן משתמשות בשפות תיכנות כלשהן, כגון HTML כאשר השפות נותנות פקודות שונות בנוגע לעיצוב.
תוכנה נוספת שיודעת "להציג על המסך" סטרינג מעוצב, נקראת וורד, והיא שייכת לחברת מייקרוסופט, היא מאחסנת את המידע אודות עיצוב התווים, בצורה אחרת (כלומר לא HTML אלא שפה שמייקרוסופט פיתחו לבד).
כשאתה מבקש סטרינג "מעוצב" עליך להקדים ולברר באיזו תוכנה אתה רוצה להשתמש, או שמא תרצה לפתח תוכנה בעצמך, ולקבור את כל מה שיש היום בשוק, כולל דפדפנים. ספר לנו על תוכניותיך בנושא, ונוכל לעזור לך יותר במדוייק.אני אישית, מעדיף את PDF כי הוא עובר לסוחר, כך שבכל פעם כשלקוח מבקש משהו, אני משתמש או בקובץ HTML ופותח לו אותו בדפדפן, או בקובץ PDF, כאשר הוא מבקש להדפיס פיזית על דף, או לשלוח כקובץ מצורף בדואר אלקטרוני.
פורסם במקור בפורום CODE613 ב31/08/2015 22:31 (+03:00)
-
רבי צבי אין מושג כזה...
תודה על התואר רבי
@ארכיטקטתוכנה נוספת שיודעת "להציג על המסך" סטרינג מעוצב, נקראת וורד, והיא שייכת לחברת מייקרוסופט, היא מאחסנת את המידע אודות עיצוב התווים, בצורה אחרת (כלומר לא HTML אלא שפה שמייקרוסופט פיתחו לבד).
האם תוכנת וורד של מייקרוסופט מסוגלת לפענח קובץ HTML ולהציג אותו עם הגדרות העיצוב שבו כמו בדפדפן
או שאין שום קשר בין היכולות של אקספלורר לוורד בקריאת נתונים
אז בדקתי, וכן יש קשר. תודה שהארת את עיני בזה
@ארכיטקטכשאתה מבקש סטרינג "מעוצב" עליך להקדים ולברר באיזו תוכנה אתה רוצה להשתמש, או שמא תרצה לפתח תוכנה בעצמך, ולקבור את כל מה שיש היום בשוק, כולל דפדפנים. ספר לנו על תוכניותיך בנושא, ונוכל לעזור לך יותר במדוייק.
המטרה שלי היא לבנות זחלן שניגש לאתר מסוים שמאמרים שם מתעדכנים כל שבוע,
להוריד את המאמר וליצא אותו ל PDF [size=85:nbb2vbim](אגב הרעין לשמור אותו ב HTML קסם לי...) [/size:nbb2vbim]אבל במאמר יש גם הדגשים מסויימים חלקם בצבע וחלקם על ידי הפרדה של שורות וגם את זה אני רוצה לקבל.
@ארכיטקטאני אישית, מעדיף את PDF כי הוא עובר לסוחר, כך שבכל פעם כשלקוח מבקש משהו, אני משתמש או בקובץ HTML ופותח לו אותו בדפדפן, או בקובץ PDF, כאשר הוא מבקש להדפיס פיזית על דף, או לשלוח כקובץ מצורף בדואר אלקטרוני.
ועכשיו השאלה האם יש ספריה HtmlToPdf מה שהבאת כאן או משהו אחר שיודע להמיר את את הקובץ Html ולזהות גם את הגדרות העיצוב שבו?
פורסם במקור בפורום CODE613 ב31/08/2015 23:40 (+03:00)
-
מנסה להעלות לך כאן קובץ דוט נט מוכן שבניתי כדי להמיר כל דבר לכל דבר, ובכללם גם HTML לPDF אולם הוא שוקל 20 מגה וזה לא עולה כאן לפורום. אז אני משתף בגוגל דרייב. תודיע לי כשהורדת כי אני לא אוהב את השיתוף הציבורי בדרייב.
פורסם במקור בפורום CODE613 ב01/09/2015 00:06 (+03:00)
-
@דוד ל.ט.
הפלוס בוורד זה הפשטות
אם אתה מדבר ביחס לספריה שהעלתי, אין שום פשטות בוורד, כשאתה רואה מה וורד עושה מאחורי הקלעים ע"מ לעבד קובץ HTML זה פשוט מזעזע, הוא ממיר הכל לתבניות שלו, ויוצר כמה וכמה קבצים נוספים מאחורי הקובץ, אז איזה פלוס נשאר לנו???
פורסם במקור בפורום CODE613 ב01/09/2015 10:41 (+03:00)
-
מנסה להעלות לך כאן קובץ דוט נט מוכן שבניתי כדי להמיר כל דבר לכל דבר, ובכללם גם HTML לPDF אולם הוא שוקל 20 מגה וזה לא עולה כאן לפורום. אז אני משתף בגוגל דרייב. תודיע לי כשהורדת כי אני לא אוהב את השיתוף הציבורי בדרייב.
גם אני הורדתי :lol:
כמובן, אם זה בסדר מבחינתך...פורסם במקור בפורום CODE613 ב01/09/2015 14:39 (+03:00)
-
מנסה להעלות לך כאן קובץ דוט נט מוכן שבניתי כדי להמיר כל דבר לכל דבר, ובכללם גם HTML לPDF אולם הוא שוקל 20 מגה וזה לא עולה כאן לפורום. אז אני משתף בגוגל דרייב. תודיע לי כשהורדת כי אני לא אוהב את השיתוף הציבורי בדרייב.
דבר ראשון תודה תודה רבה על העזרה ובפרט על הרצון לעזור זה פשוט מעודד לנסות שוב ושוב
גם כשנתקלים בקשיים למתחילים כמוניולגבי הפרויקט הורדתי ואתה יכול להסיר.
פתחתי אותו וניסיתי להמיר איתו קובץ docx ל PDF יצרתי פרויקט חדש ושלחתי לו נתונים בצורה הזאת[ static void Main(string[] args) { string[] FilesPath = new string[1]; FilesPath[0] = @"c:\temp\Test.docx"; FilesPath[1] = @"c:\temp\Test.pdf"; FormatConvertor.Program.Main(FilesPath); } הרצתי אבל הוא זורק לי חריג בשורה הזאת bool result = Bitmap2PDF(new Bitmap(SourceFileName), TargetFileName);השגיאה היא "הפרמטר אינו חוקי".
אם תוכל להסביר איך להשתמש איתו ומה האופציות שלו. תודה!
דבר שני הורדתי את החבילה שהצעת לי כאן
נתתי לו נתיב ל Html ונתיב ליצירת ה Pdf והכל עובד מצוין הקובץ נוצר.
אבל כשאני פותח את הקובץ אני רואה שהוא יצר אותו עם קידוד לא נכון, חשבתי בהתחלה לקודד אותו עם זה אבל הוא מוכן לקבל רק נתיב ולא את הקובץ עצמו
אז אולי להתערב בקוד של ה Package עצמו? זה אפשרי או שיש פתרון אחר?פורסם במקור בפורום CODE613 ב01/09/2015 18:44 (+03:00)
-
למרבה האירוניה לא בניתי תמיכה להמרת קובץ וורד לפידיאף בפרוייקט שלי, אז אשמח אם תוסיף את זה. מעבר לזה כל קובץ אמור להתאים.
לגבי הקידוד, לא צריך לעשות כלום, רק בHTML עצמו לדאוג להודיע לספרייה מהו הקידוד שלך כמובן מומלץ UTF8
פורסם במקור בפורום CODE613 ב01/09/2015 19:21 (+03:00)
-
לגבי הקידוד, לא צריך לעשות כלום, רק בHTML עצמו לדאוג להודיע לספרייה מהו הקידוד שלך כמובן מומלץ UTF8
מוזר הוספתי את ההגדרה ל Html כך
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> </head> <body> <p>The HTML head element contains meta data.</p> <p>Meta data is data about the HTML document.</p> <p>ניסיון בדיקה לזיהוי תווים בעברית עברית</p> </body> </html> וזה רק הסתבך יותר...
לא רק שה Pdf לא הצליח לזהות אלא גם כשניסיתי לפתוח את הקובץ בוויזואל הוא אז במקום העברית הוא הראה לי רק כאלה תוים �������
מה עושים? האם פספסתי איזושהי הגדרה או משהו?
את התווים באנגלית הוא כן מצליח לזהות כרגיל.פורסם במקור בפורום CODE613 ב01/09/2015 23:10 (+03:00)
-
פתח את הקובץ ב notepad++ וקודד אותו ל UTF8 לאחר מכן שמור אותו ובצע את ההמרה זה יעבוד, רוצה הוכחה? תעלה לכאן כל קובץ שתרצה ואני מביא לך אותו ב PDF.
אתה מתכוון לזה@ארכיטקט
לגבי הקידוד, לא צריך לעשות כלום, רק בHTML עצמו לדאוג להודיע לספרייה מהו הקידוד שלך כמובן מומלץ UTF8
אבל זה בדיוק מה שהעליתי כאן שעשיתי את זה וזה לא הצליח...
וזה גם דוגמא בשבילך אולי תביא לי את זה ב PDF עם קידוד טובה לעבריתפורסם במקור בפורום CODE613 ב02/09/2015 20:13 (+03:00)