Bạn không cần công nhận chữ? Công nhận văn bản

Công cụ chuyển đổi PDF sang CSV

Trích xuất dữ liệu bảng từ PDF sang CSV — miễn phí và trực tuyến

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Dữ liệu có cấu trúc

Biến bảng bị khóa trong PDF thành hàng và cột CSV sạch — sẵn sàng nhập vào Excel, cơ sở dữ liệu hay quy trình phân tích.

Sức mạnh xử lý đám mây

Trích xuất nặng chạy trên máy chủ Convertio, không phải trên máy bạn. Tải PDF lên và để đám mây xử lý.

Nhiều PDF cùng lúc

Cần dữ liệu từ nhiều PDF? Tải lên hàng loạt và trích xuất CSV từ mỗi tệp đồng thời — không cần lặp lại quy trình.

Làm thế nào để chuyển đổi PDF sang CSV

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn csv hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin csv của bạn xuống ngay sau đó

Về các định dạng

PDF (Portable Document Format — Định dạng tài liệu di động) được phát triển bởi Adobe Systems, đồng sáng lập bởi John Warnock và Charles Geschke, với phiên bản đầu tiên phát hành vào ngày 15 tháng 6 năm 1993. Xây dựng trên mô hình hình ảnh PostScript đơn giản hóa, PDF đóng gói đầy đủ mô tả tài liệu — văn bản kèm phông chữ, đồ họa vector, hình ảnh raster và các yếu tố tương tác — trong một tệp độc lập hiển thị giống hệt nhau trên mọi nền tảng, thiết bị và máy in. Định dạng này đã phát triển qua nhiều phiên bản, đạt đỉnh với việc được chấp nhận làm tiêu chuẩn quốc tế ISO 32000-1 vào năm 2008 (PDF 1.7) và ISO 32000-2 vào năm 2017 (PDF 2.0), đảm bảo tính độc lập với nhà cung cấp lâu dài. PDF hỗ trợ một loạt khả năng đặc biệt phong phú: chữ ký số, trường biểu mẫu, chú thích, đánh dấu trang, thẻ trợ năng tiếp cận, mã hóa, JavaScript, nhúng đa phương tiện, nội dung 3D và các hồ sơ dành riêng cho lưu trữ (PDF/A). Một ưu điểm là độ trung thực hình ảnh tuyệt đối — một tài liệu PDF trông giống hệt nhau dù được mở trên Windows, macOS, Linux, iOS hay Android, in trên bất kỳ máy in nào hoặc xem sau hàng thập kỷ kể từ khi tạo. Hỗ trợ phần mềm toàn cầu là một thế mạnh cốt lõi khác: trình xem PDF được tích hợp sẵn trong mọi hệ điều hành và trình duyệt web lớn, và định dạng này được đọc bởi hàng trăm ứng dụng trên thế giới. Các hồ sơ ISO chuyên biệt như PDF/A (lưu trữ), PDF/X (sản xuất in) và PDF/UA (trợ năng tiếp cận) mở rộng phạm vi của định dạng vào các ngành công nghiệp được quản lý. PDF đã trở thành tiêu chuẩn toàn cầu cho trao đổi tài liệu trong kinh doanh, chính phủ, pháp lý, học thuật và xuất bản.
Nhà phát triển: Adobe Systems
Phát hành lần đầu: Ngày 15 tháng 6 năm 1993
CSV (Comma-Separated Values — Giá trị phân cách bằng dấu phẩy) là định dạng văn bản thuần túy dùng để lưu trữ dữ liệu dạng bảng, trong đó mỗi dòng đại diện cho một hàng và các trường trong hàng được phân cách bằng dấu phẩy. Định dạng này bắt nguồn từ máy tính lớn IBM vào đầu những năm 1970 để trao đổi dữ liệu giữa các chương trình và kể từ đó đã trở thành định dạng chung nhất cho việc trao đổi dữ liệu có cấu trúc. Mặc dù trông đơn giản, CSV có những điểm phức tạp tiềm ẩn: các trường chứa dấu phẩy, ký tự xuống dòng hoặc dấu nháy kép phải được đặt trong dấu nháy kép, và các dấu nháy kép nhúng sẽ được thoát bằng cách nhân đôi. RFC 4180, công bố năm 2005, đã chuẩn hóa các quy ước này, nhưng các triển khai CSV vẫn khác nhau đáng kể giữa các phần mềm, với sự khác biệt về ký tự phân cách (dấu chấm phẩy ở nhiều vùng châu Âu), ký tự xuống dòng, mã hóa ký tự và quy tắc dấu nháy. Một ưu điểm là tính phổ quát tuyệt đối — mọi ứng dụng bảng tính, hệ thống cơ sở dữ liệu, ngôn ngữ lập trình và công cụ phân tích dữ liệu đều có thể đọc và ghi CSV, khiến nó trở thành định dạng an toàn nhất để trao đổi dữ liệu giữa các hệ thống không tương thích. Bản chất văn bản thuần túy là một thế mạnh cốt lõi khác: các tệp CSV có thể mở bằng bất kỳ trình soạn thảo văn bản nào, xử lý bằng các công cụ dòng lệnh như awk và sed, quản lý phiên bản với Git, và đọc từng dòng mà không cần tải toàn bộ tập dữ liệu vào bộ nhớ. CSV vẫn là định dạng xuất mặc định cho cơ sở dữ liệu, nền tảng phân tích web, thiết bị khoa học và cổng dữ liệu mở của chính phủ trên toàn thế giới.
Nhà phát triển: IBM
Phát hành lần đầu: 1972

Các câu hỏi thường gặp

Tại sao chuyển PDF sang CSV?

CSV cho phép bạn xử lý dữ liệu bảng PDF trong bảng tính và cơ sở dữ liệu — sắp xếp, lọc, phân tích mà không cần nhập lại thủ công.

Chương trình nào mở CSV?

Microsoft Excel, Google Sheets, LibreOffice Calc, Apple Numbers và hầu hết mọi công cụ phân tích dữ liệu hay ngôn ngữ lập trình.

Có trích xuất được bảng phức tạp không?

Convertio trích xuất nội dung dạng bảng từ các trang PDF. Bố cục rất phức tạp hoặc ô hợp nhất có thể cần chỉnh sửa thêm sau trích xuất.

Văn bản ngoài bảng có được bao gồm không?

Chuyển đổi tập trung vào nội dung có cấu trúc. Đoạn văn ngoài bảng có thể xuất hiện dưới dạng hàng đơn cột.

Sử dụng có giới hạn trang không?

Bạn có thể chuyển PDF sang CSV miễn phí trên Convertio. Gói cao cấp mở thêm dung lượng cho tác vụ lớn hơn hoặc thường xuyên hơn.

Có xử lý được PDF nhiều trang không?

Có — dữ liệu từ tất cả các trang PDF được trích xuất và tổng hợp vào tệp CSV kết quả.

Xếp hạng chất lượng từ PDF đến CSV

4.3 (32,938 phiếu bầu)
Bạn cần phải chuyển đổi và tải xuống ít nhất 1 tệp để cung cấp phản hồi!