Python library สำหรับแปลงไฟล์ทุกประเภทให้เป็น Markdown
เพื่อใช้กับ LLM และ Text Analysis Pipeline
ทำไมต้องเป็น Markdown?
Markdown คือรูปแบบที่ LLM อย่าง GPT-4o "พูดได้" อย่างเป็นธรรมชาติ เพราะถูกฝึกมากับข้อมูล Markdown จำนวนมหาศาล — ทำให้ output ที่ได้จาก MarkItDown เหมาะสำหรับใส่เป็น context ใน AI pipeline โดยตรง
นอกจากนี้ Markdown ยังประหยัด Token มากกว่า HTML หรือ XML อีกด้วย
python -m venv .venv source .venv/bin/activate # Mac/Linux .venv\Scripts\activate # Windows
pip install 'markitdown[all]'
pip install 'markitdown[pdf, docx, pptx]'
docker build -t markitdown:latest . docker run --rm -i markitdown:latest < file.pdf > output.md
# แปลงไฟล์ → stdout markitdown file.pdf # บันทึกลงไฟล์ markitdown file.pdf -o output.md # ใช้ pipe cat file.pdf | markitdown # ดู plugins markitdown --list-plugins # ใช้งาน plugins markitdown --use-plugins file.pdf
from markitdown import MarkItDown
# การใช้งานพื้นฐาน
md = MarkItDown(enable_plugins=False)
result = md.convert("test.xlsx")
print(result.text_content)
# ใช้ LLM อธิบายรูปภาพ
from openai import OpenAI
client = OpenAI()
md = MarkItDown(
llm_client=client,
llm_model="gpt-4o"
)
result = md.convert("photo.jpg")
print(result.text_content)
ดึงข้อความจากรูปภาพที่ฝังอยู่ใน PDF, DOCX, PPTX, XLSX โดยใช้ LLM Vision ไม่ต้องติดตั้ง ML library เพิ่มเติม
pip install markitdown-ocr openai
from markitdown import MarkItDown
from openai import OpenAI
md = MarkItDown(
enable_plugins=True,
llm_client=OpenAI(),
llm_model="gpt-4o",
)
result = md.convert("doc_with_images.pdf")
print(result.text_content)
ใช้ Azure Document Intelligence แปลง PDF ที่ซับซ้อน — layout analysis และ OCR คุณภาพสูงบน cloud
markitdown file.pdf -o output.md -d -e "<doc_intelligence_endpoint>"
md = MarkItDown(docintel_endpoint="<endpoint>")
result = md.convert("scan.pdf")
บริการ cloud ของ Microsoft ที่รองรับ Video (ซึ่ง built-in ไม่มี), Audio คุณภาพสูง, การ extract field เฉพาะทาง (ใบแจ้งหนี้, ใบเสร็จ) เป็น YAML front matter
| ความสามารถ | Built-in | Doc Intel | Content Understanding |
|---|---|---|---|
| แปลงเอกสาร | ✓ Offline | ✓ Cloud | ✓ Cloud Multimodal |
| Video | ✗ | ✗ | ✓ |
| Structured Fields | ✗ | ✗ | ✓ YAML front matter |
| Custom Analyzer | ✗ | ✗ | ✓ |
| ค่าใช้จ่าย | Local เท่านั้น | Billable API | Billable API |
md = MarkItDown(cu_endpoint="<content_understanding_endpoint>")
result = md.convert("report.pdf") # → prebuilt-documentSearch
result = md.convert("meeting.mp4") # → prebuilt-videoSearch
result = md.convert("call.wav") # → prebuilt-audioSearch
เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า
คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น
ยอมรับทั้งหมดประเภทของคุกกี้มีความจำเป็นสำหรับการทำงานของเว็บไซต์ เพื่อให้คุณสามารถใช้ได้อย่างเป็นปกติ และเข้าชมเว็บไซต์ คุณไม่สามารถปิดการทำงานของคุกกี้นี้ในระบบเว็บไซต์ของเราได้
คุกกี้ประเภทนี้จะทำการเก็บข้อมูลการใช้งานเว็บไซต์ของคุณ เพื่อเป็นประโยชน์ในการวัดผล ปรับปรุง และพัฒนาประสบการณ์ที่ดีในการใช้งานเว็บไซต์ ถ้าหากท่านไม่ยินยอมให้เราใช้คุกกี้นี้ เราจะไม่สามารถวัดผล ปรับปรุงและพัฒนาเว็บไซต์ได้
รายละเอียดคุกกี้
คุกกี้ประเภทนี้จะเก็บข้อมูลต่าง ๆ รวมทั้งข้อมูลส่วนบุคคลเกี่ยวกับตัวคุณเพื่อเราสามารถนำมาวิเคราะห์ และนำเสนอเนื้อหา ให้ตรงกับความเหมาะสมกับความสนใจของคุณ ถ้าหากคุณไม่ยินยอมเราจะไม่สามารถนำเสนอเนื้อหาและโฆษณาได้ไม่ตรงกับความสนใจของคุณ
รายละเอียดคุกกี้