Công Cụ Mạnh Mẽ: Trí Tuệ Nhân Tạo Và Chatbots
Chúng ta đã quen với trí tuệ nhân tạo (AI), ChatGPT, và các chatbot tương tự. Thực tế, nhiều người sử dụng các giải pháp như ChatGPT để viết mã, script, và chương trình mà không cần hoặc chỉ cần kiến thức lập trình hạn chế.
Việc cung cấp hướng dẫn chi tiết dưới dạng prompts và làm việc với chatbot để xây dựng các công cụ chỉ trong vài giây đã trở nên đơn giản. Điều quan trọng nhất, đây là những công cụ đang thay đổi cách chúng ta tiếp cận công việc hàng ngày của mình.
ChatGPT trích xuất
Nhiệm Vụ
Nhưng làm thế nào nếu chúng ta muốn trích xuất dữ liệu không chuẩn so với tiêu đề hoặc mô tả trang?
Ví dụ, làm thế nào nếu chúng ta muốn trích xuất dữ liệu từ trang PPC front page của Search Engine Journal?
Liệt kê tất cả các bài viết nổi bật, tác giả của họ, các liên kết URL, và mô tả bài viết cho các cột được liệt kê trên https://www.searchenginejournal.com/category/paid-media/pay-per-click/.
Liệu chúng ta có thể làm điều đó trực tiếp với ChatGPT?
ChatGPT trích xuất từ 30 bài viết
Thực Hiện Với ChatGPT
Khi tạo prompts, việc cung cấp hướng dẫn chi tiết mất vài lần thử để chatbot hiểu đúng mục tiêu của nhiệm vụ và trả về kết quả tốt.
Trong nhiều trường hợp, cảm giác như AI đang gặp áp lực để trả kết quả nhanh chóng mặc dù độ chính xác của chúng.
Nhiệm vụ là phân tích trang và liệt kê tất cả các bài viết nổi bật, tác giả của họ, liên kết URL, và mô tả cho mỗi trong số 30 bài viết được liệt kê trên trang. Sau đó tổng hợp dữ liệu vào một bảng và cuối cùng xuất thành file CSV.
Đơn giản phải không?
ChatGPT hướng dẫn trích xuất
Ban đầu, ChatGPT chỉ trả về một số mẫu bài viết và chỉ tiêu đề và URL của chúng; sau khi thay đổi prompts, nó đã quản lý liệt kê và xuất tất cả 30 bài viết và liên kết của chúng.
Google Sheets
Kết Luận
Vì vậy, quay trở lại với IMPORTXML và Google Sheets.
Lần này, việc yêu cầu ChatGPT cung cấp các công thức cho từng trường giống như một cơn gió.
Dưới đây là một số công thức, theo gợi ý của chatbot, mà bạn có thể dễ dàng thử trong Google Sheets để trích xuất:
- Tiêu đề
=IMPORTXML('https://www.searchenginejournal.com/category/paid-media/pay-per-click/', '//*[@id='archives-wrapper']/article/div/div[2]/h2/a')
- Tên Tác Giả
=IMPORTXML('https://www.searchenginejournal.com/category/paid-media/pay-per-click/', '//*[@id='archives-wrapper']/article/div/div[2]/p[1]/a')
- Liên Kết URL
=IMPORTXML('https://www.searchenginejournal.com/category/paid-media/pay-per-click/', '//*[@id='archives-wrapper']/article/div/div[2]/h2/a/@href')
- Mô Tả
=IMPORTXML('https://www.searchenginejournal.com/category/paid-media/pay-per-click/', '//*[@id='archives-wrapper']/article/div/div[2]/p[2]')
Google Sheets kết quả trích xuất
So Sánh
Với kinh nghiệm của mình, tôi không thể tìm thấy cách dễ dàng và nhanh chóng để sử dụng ChatGPT để trích xuất dữ liệu mà tôi đang tìm kiếm - điều này không có nghĩa là không thể, và có thể có nhiều cách để làm điều này, nhưng tôi không tìm thấy bất kỳ cách nào.
Điều hoạt động với tôi là sự kết hợp của các công cụ khác nhau, và điều đó đã phục vụ rất tốt cho mục đích mà tôi đang nhắm tới.
ChatGPT rất hữu ích để viết các công thức IMPORTXML mà tôi cần sử dụng trong Google Sheets, và những công thức đó đã hoàn thành phần còn lại.
Một lợi ích bổ sung của tùy chọn ChatGPT + Google Sheets là bạn có thể sử dụng phiên bản miễn phí 3.5 của ChatGPT và lấy công cụ để xây dựng các công thức IMPORTXML của bạn, thay vì phải có phiên bản 4 để quét trang và trích xuất dữ liệu.
Kết Luận Quan Trọng
Điều này làm nổi bật một khía cạnh quan trọng về cách trí tuệ nhân tạo đã thay đổi cách chúng ta suy nghĩ và làm việc.
Công cụ tốt nhất cho công việc không chỉ là sử dụng AI, Google Sheets, hoặc bất kỳ phần mềm cụ thể nào mà là sự kết hợp của các công cụ và kỹ năng.
Chỉ thông qua việc tiếp cận tích hợp này, chúng ta phát triển quy trình làm việc hiệu quả và hiệu quả, làm tăng năng suất tổng thể của chúng ta.