Tải tệp lên
Bạn có thể tải các tệp tin dữ liệu với định dạng phổ biến như Excel, CSV, ... để bắt đầu làm việc trên Dataverses.
Để đồng bộ dữ liệu thời gian thực từ các nền tảng thương mại điện tử được hỗ trợ, xem Tích hợp API.
Điều kiện sử dụng
Trước khi bắt đầu, bạn cần đảm bảo:
- Có tài khoản Dataverses với tính năng Thương mại điện tử được kích hoạt
- Được cấp quyền tải dữ liệu lên
- Có tệp dữ liệu đã xuất từ nền tảng thương mại điện tử của bạn
Các định dạng tệp được hỗ trợ
| Định dạng | Phần mở rộng | Ghi chú |
|---|---|---|
| CSV | .csv | Khuyến nghị cho dữ liệu dạng bảng |
| Excel | .xlsx, .xls | Hỗ trợ tệp nhiều sheet |
| JSON | .json | Cho dữ liệu lồng nhau hoặc có cấu trúc |
| Parquet | .parquet | Tối ưu cho tập dữ liệu lớn |
Xem hướng dẫn bằng video
Xem video hướng dẫn tải tệp lên bên dưới:
Tải tệp tin lên
Bước 1: Chọn Dữ liệu → Tải tệp tin
Trên thanh điều hướng, chọn Dữ liệu → Tải tệp tin. Bạn chọn tệp tin cần tải lên hệ thống. Chúng tôi hỗ trợ các định dạng CSV, Excel, JSON và Parquet.
Bước 2: Nhấn nút Tải tệp tin
Hệ thống sẽ tự động xử lý tệp bao gồm nhận dạng kiểu dữ liệu và tên cột tương ứng. Bạn có thể thay đổi tên cột hoặc tên bảng sau khi quá trình tải lên hoàn tất. Khi hoàn tất, sẽ có thông báo ở góc phía bên phải màn hình.
Chi tiết theo từng định dạng
Tệp CSV
Tệp CSV là định dạng đơn giản nhất để nhập dữ liệu dạng bảng. Mỗi tệp CSV sẽ được tạo thành một bảng tương ứng.
- Mã hóa: Khuyến nghị sử dụng mã hóa UTF-8 để đảm bảo tiếng Việt hiển thị chính xác.
- Dấu phân cách: Hệ thống tự động nhận dạng dấu phân cách phổ biến (dấu phẩy, dấu chấm phẩy, dấu tab).
- Dòng tiêu đề: Dòng đầu tiên sẽ được dùng làm tên cột.
Ví dụ cấu trúc tệp CSV:
order_id,product_name,quantity,price,order_date
ORD-001,Chuột không dây,2,25.99,2024-01-15
ORD-002,Bàn phím cơ,1,89.50,2024-01-16
Tệp Excel
Dataverses có thể xử lý tệp Excel mà không cần bạn phải chỉnh sửa bất kỳ thông tin nào trong tệp. Hệ thống sẽ tự động nhận dạng vùng thông tin dạng bảng và nhập dữ liệu trong vùng cần thiết.
Nếu tệp Excel của bạn có nhiều sheet, bạn có thể chọn sheet muốn nhập dữ liệu thay vì nhập toàn bộ. Mỗi sheet sẽ được tạo thành một bảng tương ứng.
Tệp JSON
Tệp JSON phù hợp cho dữ liệu có cấu trúc lồng nhau hoặc dữ liệu xuất từ API. Hệ thống hỗ trợ các định dạng JSON sau:
- Mảng đối tượng: Mỗi đối tượng trong mảng sẽ trở thành một dòng trong bảng.
- Đối tượng lồng nhau: Các thuộc tính lồng nhau sẽ được làm phẳng tự động thành các cột riêng biệt.
Ví dụ cấu trúc tệp JSON:
[
{"order_id": "ORD-001", "product": {"name": "Chuột không dây", "price": 25.99}, "quantity": 2},
{"order_id": "ORD-002", "product": {"name": "Bàn phím cơ", "price": 89.50}, "quantity": 1}
]
Sau khi tải lên, các thuộc tính lồng nhau sẽ được làm phẳng thành các cột như product.name, product.price.
Tệp Parquet
Tệp Parquet là định dạng cột được tối ưu cho tập dữ liệu lớn. Định dạng này có sẵn lược đồ dữ liệu (schema) nên hệ thống không cần nhận dạng kiểu dữ liệu thủ công.
- Lược đồ tự động: Kiểu dữ liệu của từng cột được xác định sẵn trong tệp Parquet, giúp quá trình nhập chính xác hơn.
- Hiệu suất: Phù hợp cho tệp dung lượng lớn nhờ tỷ lệ nén cao và khả năng đọc từng cột.
- Một tệp một bảng: Mỗi tệp Parquet sẽ được tạo thành một bảng tương ứng.
Bước tiếp theo
Sau khi dữ liệu đã được tải lên:
- Quản lý dữ liệu - Khám phá và quản lý dữ liệu đã nhập
- Tích hợp API - Thiết lập đồng bộ thời gian thực cho dữ liệu liên tục
- Bảng điều khiển - Xây dựng trực quan và theo dõi KPI