Nội dung công việc
- Phân tích cấu trúc website và xác định các trường dữ liệu cần lấy
- Viết script crawl dữ liệu (Python hoặc ngôn ngữ phù hợp)
- Thu thập đầy đủ các thông tin theo yêu cầu (text, link, hình ảnh nếu cần)
- Xử lý dữ liệu (lọc, làm sạch, loại trùng…)
- Xuất dữ liệu ra file Excel (.xlsx) với format rõ ràng, dễ sử dụng
- Đảm bảo code chạy ổn định, có thể sử dụng lại
Yêu cầu
- Có kinh nghiệm crawl data/web scraping
- Thành thạo Python (BeautifulSoup, Selenium, Scrapy…) hoặc tương đương
- Hiểu cấu trúc HTML, xử lý dữ liệu tốt
- Có thể xử lý các trường hợp chặn bot cơ bản (nếu có)
- Làm việc cẩn thận, đúng deadline
Kết quả mong muốn
- File Excel đầy đủ, đúng cấu trúc yêu cầu
- Code crawl hoạt động ổn định, dễ sử dụng lại















Đánh giá
Chưa có đánh giá nào.