
Lý do thứ hai là ngữ nghĩa được giữ sạch. Markdown chỉ có vài tag cốt lõi: # cho heading, * cho list, ` cho code, ** cho bold, text cho link. Mỗi tag tương ứng với một loại ngữ nghĩa rõ ràng. AI không phải lọc qua hàng tá các phần CSS để tìm ra đâu là tiêu đề của nội dung đang đọc.
Lý do thứ ba là Markdown thật sự thân thiện với người dùng. Có lẽ anh em làm tech ở Việt Nam phần lớn đã quen Markdown qua README GitHub, doc Notion của team, hoặc qua các blog tech. Thật sự Markdown rất dễ đọc, không chỉ với anh em dev. Người không phải dev cũng đọc được trên Notion, Obsidian, Slack, Discord. Cùng một file, cả người và AI đọc được mà không cần các công cụ đặc biệt. Điều này nghe đơn giản nhưng nó là lý do Markdown lan ra ngoài cộng đồng dev nhanh đến vậy lại rất tiện lợi khi là format mà AI ưa thích.
Trong khi đó, HTML vẫn tồn tại và lại càng có lý do để nó tồn tại
Dù Markdown gọn hơn, HTML vẫn là một định dạng nội dung anh em không thể bỏ. Lý do đơn giản: web vẫn chạy trên HTML. Mọi trang web anh em mở, mọi bài viết anh em đọc, mọi trang web thương mại điện tử anh em mua hàng đều có HTML ở dưới. Và khi AI agent muốn duyệt web để lấy thông tin, scrape data, đọc tin tức, nó phải hiểu HTML.
HTML cũng có tiêu chuẩn ngữ nghĩa khá tốt nếu được viết một cách tinh gọn. Các tag h1, h2, table, ul, li, article đều mang ngữ nghĩa rõ ràng. Vấn đề là trong thực tế, các trang web sản xuất hiếm khi viết HTML một cách gọn gàng sạch sẽ. Một div với 5 class lồng trong 10 div khác là chuyện bình thường, và đây là nội dung nhiễu mà AI phải lọc qua.
Và rõ ràng, đó là cái đánh đổi với định dạng này. Cách xử lý phổ biến hiện nay là chuyển đổi HTML sang Markdown trước khi đưa cho AI. Hiện có một vài cách để anh em thực hiện việc này. Một trong số đó là sử dụng các package như html2text (Python) hoặc turndown (JavaScript) để convert tự động. Một số crawler hiện đại cũng đã có sẵn option xuất Markdown thay vì HTML thô, được thiết kế cho việc đưa nội dung vào AI. Trong Claude và một số AI khác, anh em có thể paste link và để hệ thống ở dưới tự xử lý phần convert này.
Ngoài ra, có một vai trò phụ cũng đáng nhắc đến. Đó là khi anh em muốn AI cho ra một nội dung/thành phần dễ dàng để hiển thị trên UI hoặc CMS thì HTML là format cần sử dụng. Ví dụ anh em build một component web, muốn AI sinh ra HTML kèm class Tailwind sẵn để paste thẳng vào project, đây là trường hợp mà HTML có ý nghĩa hơn hẳn file markdown.
Trải nghiệm thực tế và cách Claude phản ứng với format
Nói một chút về trải nghiệm cá nhân thì khi mình làm việc với anh em dev trên các dự án, viết spec hoặc bug report bằng Markdown là một bước nhảy vọt về mặt hiệu quả công việc. Lý do là vì anh em dev hiện nay phần lớn dùng AI assistant tích hợp trong IDE như Cursor, Windsurf, Copilot, hoặc Claude Code. Khi spec viết bằng Markdown, anh em paste thẳng vào AI là mã lệnh có thể dễ dàng được tạo ra mà không cần reformat lại. Trong khi nếu sử dụng cùng nội dung đó dưới dạng Word doc, hoặc tệ hơn là screenshot, AI mất đi ngữ cảnh về cấu trúc, có thể hiểu sai requirement, và code tạo ra có thể sai hoàn toàn.

Markdown khiến AI làm việc hiệu quả hơn
Tương tự với việc tương tác với dữ liệu. Khi cần, mình thử đưa một bảng số liệu cho AI phân tích, CSV gọn hơn nhiều so với Excel có 10 sheet và format đẹp. Excel có nhiều thứ không phải data: các cell dữ liệu được gộp lại, màu sắc, conditional formatting, sheet ẩn. AI không quan tâm đến những cái đó, nó cần bảng số liệu thuần. Một file CSV 50KB có thể chứa cùng lượng thông tin như một file XLSX 5MB, AI đọc CSV nhanh hơn, ít token hơn, ít sai sót hơn.
Và chính cả Anthropic, công ty làm ra Claude, đã chính thức khuyên trong tài liệu prompt engineering của họ là dùng XML-style tag để bọc các phần khác nhau của prompt. Ví dụ bọc context trong
Một set practice cho anh em
Viết dông dài, cốt để anh em hiểu rằng Markdown và HTML ra đời lâu rồi, với mục đích cụ thể nhất định nhưng theo dòng thời gian lại trở thành định dạng hữu ích để anh em làm việc với AI. Vì thế, anh em nên cân nhắc
- Viết các doc kỹ thuật bằng Markdown thay vì Word. README, spec, bug report đều thế.
- Với Data, anh em có thể dùng file CSV thay vì Excel format đẹp. AI không cần màu sắc, nó cần số liệu.
- Với Web: chuyển đổi HTML sang Markdown trước khi đưa cho AI xử lý. Anh em có thể search ‘html to markdown’ để tìm tool phù hợp.
- Code: luôn paste trong markdown code fence (ba dấu ` liền nhau). AI nhận diện ngay đây là code, không paraphrase.
- Prompt cho Claude: dùng XML tag để bọc context, instruction, example. Bài bản hơn, output cũng bài bản hơn.
Cơ bản thì, format anh em chọn cho AI cũng quan trọng không kém gì cách anh em viết prompt. Một cái spec viết bằng Markdown đôi khi cho output tốt hơn nhiều một prompt thông minh viết trong file Word. Hai format ra đời từ thời chưa ai nghĩ đến AI, hóa ra lại là chìa khóa để work tốt với AI ngày nay. Đây là một trong những trùng hợp đáng giá nhất của lịch sử công nghệ.
công nghệ, khoa học, kĩ thuật, mẹo vặt, cộng đồng, thảo luận, hỏi đáp, sửa lỗi, máy tính, sự cố, camera, lỗi điện thoại, lỗi máy tính#Markdown #và #HTML #đời #từ #rất #lâu #lại #trở #thành #định #dạng #nội #dung #mà #Agent #cực #kì #ưa #thích1778350691









