שינוי קבצי וורד (.doc) באמצעות פייתון

הי ינון,

האמת היא שכבר הודתי על הקורס המחכים, ועכשיו הזדמנות נוספת להודות… מעניין מחכים ומובן מאד!!!

ועכשיו יש לי שאלה, אשמח אם תוכל לענות.

אני צריכה לבדוק קבצי וורד ואם קיים מלל מסויים באחד מהם לשנות את המלל למשהו אחר.

איך אני עושה את זה בפייתון? (אני לא זוכרת שדיברנו בקורס על קבצי וורד, אם כן, אשמח שתפנה אותי למס’ שיעור)

תודה רבה,
אורטל

הי אורטל,

בפייתון כמו בפייתון, תמיד יש איזה חבילה שיכולה לעזור. במקרה של קבצי וורד היא נקראת python-docx ואפשר למצוא אותה כשמחפשים בגוגל python word pip

זו תוכנית לדוגמא שמדפיסה את כל הטקסט מקובץ וורד:

import docx

def getText(filename):
    doc = docx.Document(filename)
    fullText = []
    for para in doc.paragraphs:
        fullText.append(para.text)
    return '\n'.join(fullText)

ואת יכולה למצוא עוד מידע בתיעוד של החבילה או בפוסט הזה:
https://automatetheboringstuff.com/chapter13/