Chuyển tới nội dung chính

Tải tệp lên

Bạn có thể tải các tệp tin dữ liệu với định dạng phổ biến như Excel, CSV, ... để bắt đầu làm việc trên Dataverses.

thông tin

Để đồng bộ dữ liệu thời gian thực từ các nền tảng thương mại điện tử được hỗ trợ, xem Tích hợp API.

Điều kiện sử dụng

Trước khi bắt đầu, bạn cần đảm bảo:

  • Có tài khoản Dataverses với tính năng Thương mại điện tử được kích hoạt
  • Được cấp quyền tải dữ liệu lên
  • Có tệp dữ liệu đã xuất từ nền tảng thương mại điện tử của bạn

Các định dạng tệp được hỗ trợ

Định dạngPhần mở rộngGhi chú
CSV.csvKhuyến nghị cho dữ liệu dạng bảng
Excel.xlsx, .xlsHỗ trợ tệp nhiều sheet
JSON.jsonCho dữ liệu lồng nhau hoặc có cấu trúc
Parquet.parquetTối ưu cho tập dữ liệu lớn

Xem hướng dẫn bằng video

Xem video hướng dẫn tải tệp lên bên dưới:


Tải tệp tin lên

Bước 1: Chọn Dữ liệuTải tệp tin

Trên thanh điều hướng, chọn Dữ liệuTải tệp tin. Bạn chọn tệp tin cần tải lên hệ thống. Chúng tôi hỗ trợ các định dạng CSV, Excel, JSON và Parquet.

Bước 2: Nhấn nút Tải tệp tin

Hệ thống sẽ tự động xử lý tệp bao gồm nhận dạng kiểu dữ liệu và tên cột tương ứng. Bạn có thể thay đổi tên cột hoặc tên bảng sau khi quá trình tải lên hoàn tất. Khi hoàn tất, sẽ có thông báo ở góc phía bên phải màn hình.


Chi tiết theo từng định dạng

Tệp CSV

Tệp CSV là định dạng đơn giản nhất để nhập dữ liệu dạng bảng. Mỗi tệp CSV sẽ được tạo thành một bảng tương ứng.

  • Mã hóa: Khuyến nghị sử dụng mã hóa UTF-8 để đảm bảo tiếng Việt hiển thị chính xác.
  • Dấu phân cách: Hệ thống tự động nhận dạng dấu phân cách phổ biến (dấu phẩy, dấu chấm phẩy, dấu tab).
  • Dòng tiêu đề: Dòng đầu tiên sẽ được dùng làm tên cột.

Ví dụ cấu trúc tệp CSV:

order_id,product_name,quantity,price,order_date
ORD-001,Chuột không dây,2,25.99,2024-01-15
ORD-002,Bàn phím cơ,1,89.50,2024-01-16

Tệp Excel

mẹo

Dataverses có thể xử lý tệp Excel mà không cần bạn phải chỉnh sửa bất kỳ thông tin nào trong tệp. Hệ thống sẽ tự động nhận dạng vùng thông tin dạng bảng và nhập dữ liệu trong vùng cần thiết.

Nếu tệp Excel của bạn có nhiều sheet, bạn có thể chọn sheet muốn nhập dữ liệu thay vì nhập toàn bộ. Mỗi sheet sẽ được tạo thành một bảng tương ứng.

Tệp JSON

Tệp JSON phù hợp cho dữ liệu có cấu trúc lồng nhau hoặc dữ liệu xuất từ API. Hệ thống hỗ trợ các định dạng JSON sau:

  • Mảng đối tượng: Mỗi đối tượng trong mảng sẽ trở thành một dòng trong bảng.
  • Đối tượng lồng nhau: Các thuộc tính lồng nhau sẽ được làm phẳng tự động thành các cột riêng biệt.

Ví dụ cấu trúc tệp JSON:

[
{"order_id": "ORD-001", "product": {"name": "Chuột không dây", "price": 25.99}, "quantity": 2},
{"order_id": "ORD-002", "product": {"name": "Bàn phím cơ", "price": 89.50}, "quantity": 1}
]

Sau khi tải lên, các thuộc tính lồng nhau sẽ được làm phẳng thành các cột như product.name, product.price.

Tệp Parquet

Tệp Parquet là định dạng cột được tối ưu cho tập dữ liệu lớn. Định dạng này có sẵn lược đồ dữ liệu (schema) nên hệ thống không cần nhận dạng kiểu dữ liệu thủ công.

  • Lược đồ tự động: Kiểu dữ liệu của từng cột được xác định sẵn trong tệp Parquet, giúp quá trình nhập chính xác hơn.
  • Hiệu suất: Phù hợp cho tệp dung lượng lớn nhờ tỷ lệ nén cao và khả năng đọc từng cột.
  • Một tệp một bảng: Mỗi tệp Parquet sẽ được tạo thành một bảng tương ứng.

Bước tiếp theo

Sau khi dữ liệu đã được tải lên: