
Analytics Engineer là ai?
Analytics Engineer: Vai trò ở giữa Data Engineer và Data Analyst – và vì sao người mới cần một lộ trình đúng
Trong vài năm gần đây, khi tìm hiểu về data, bạn có thể nghe đến rất nhiều vai trò khác nhau: Data Analyst, Data Engineer, Data Scientist.
Và rồi xuất hiện thêm một cái tên mới: Analytics Engineer.
Với người mới hoặc người chuyển ngành, điều này thường gây bối rối:
- Analytics Engineer là ai?
- Khác gì với Data Analyst?
- Có phải là một bước đệm sang Data Scientist không?
Bài viết này không nhằm “quảng bá” một vai trò mới.
Mục tiêu của nó là giải thích đúng bản chất Analytics Engineer, và vì sao nếu học sai ngay từ đầu, người mới rất dễ lạc hướng.
1. Analytics Engineer là ai – và họ đứng ở đâu trong team data?
Trong một team data điển hình, thường có ba vai trò chính:
-
Data Engineer
Tập trung vào việc đưa dữ liệu từ các hệ thống khác nhau (app, website, CRM, ads…) về kho dữ liệu.
Công việc của họ liên quan nhiều đến ingestion, hạ tầng, độ ổn định và hiệu năng. -
Data Analyst
Sử dụng dữ liệu để trả lời câu hỏi kinh doanh, tạo báo cáo, dashboard và insight cho business.
Vấn đề nằm ở chỗ:
Dữ liệu mà Data Engineer đưa về thường chưa sẵn sàng để Data Analyst sử dụng ngay.
Nó có thể:
- Chưa thống nhất logic
- Chưa được tổ chức theo góc nhìn business
- Mỗi bảng một kiểu, mỗi metric một cách tính
Analytics Engineer xuất hiện để lấp khoảng trống đó.
Họ đứng giữa Data Engineer và Data Analyst:
- Không làm hạ tầng phức tạp như Data Engineer
- Không làm phân tích ad-hoc như Data Analyst
Công việc cốt lõi của Analytics Engineer là:
Biến dữ liệu thô thành dữ liệu có cấu trúc, nhất quán,
và có thể dùng lâu dài cho phân tích.
2. Vì sao vai trò này ngày càng quan trọng?
Khi công ty còn nhỏ, Data Analyst có thể:
- Viết query trực tiếp trên dữ liệu thô
- Tự xử lý logic trong từng báo cáo
Nhưng khi dữ liệu lớn dần:
- Mỗi analyst viết một logic khác nhau
- Cùng một chỉ số nhưng mỗi dashboard ra một con số
- Business bắt đầu mất niềm tin vào dữ liệu
Analytics Engineer giải quyết vấn đề này bằng cách:
- Chuẩn hóa logic business
- Tổ chức dữ liệu theo mô hình rõ ràng
- Tạo ra các bảng dữ liệu “analytics-ready”
Nhờ đó:
- Data Analyst tập trung vào phân tích thay vì dọn dữ liệu
- Business dùng chung một nguồn số liệu
- Dữ liệu trở thành tài sản, không phải gánh nặng
3. Vì sao người mới học data thường bị lạc hướng?
Rất nhiều người mới bắt đầu học data theo cách:
- Học SQL trước
- Học Python trước
- Học tool trước
Nhưng sau một thời gian, họ gặp cảm giác:
- Biết cú pháp nhưng không hiểu dùng để làm gì
- Viết được query nhưng không biết đang phục vụ ai
- Không hình dung được dữ liệu trong công ty vận hành ra sao
Nguyên nhân không phải vì họ thiếu khả năng.
Nguyên nhân là họ học kỹ thuật trước khi hiểu vai trò và bối cảnh.
Với Analytics Engineer, điều này càng nguy hiểm:
- Nếu không hiểu vị trí “ở giữa”
- Bạn sẽ học lệch sang:
- Hạ tầng quá sâu
- Hoặc phân tích quá vụn vặt
4. Tư duy thiết kế một lộ trình học Analytics Engineer cho người mới
Một lộ trình hợp lý cho người trái ngành không nên bắt đầu từ tool.
4.1. Bắt đầu từ mindset: dữ liệu dùng để làm gì?
Trước khi học bất kỳ ngôn ngữ nào, người học cần hiểu:
- Dữ liệu phục vụ quyết định kinh doanh như thế nào?
- Một chỉ số business được tạo ra từ dữ liệu ra sao?
- Vì sao “dữ liệu đúng” quan trọng hơn “query chạy được”?
Đây là nền tảng tư duy cho mọi bước sau.
4.2. Hiểu business & dữ liệu trước khi học code
Analytics Engineer không làm việc với dữ liệu trừu tượng.
Họ làm việc với:
- Dữ liệu marketing
- Dữ liệu bán hàng
- Dữ liệu hành vi người dùng
Người học cần hiểu:
- Mỗi hoạt động business tạo ra dữ liệu gì
- Dữ liệu thô khác gì dữ liệu phục vụ phân tích
- Vì sao cần chuẩn hóa và mô hình hóa dữ liệu
4.3. Dùng Python để hiểu pipeline, không phải để làm developer
Python trong lộ trình này được dùng để:
- Nhìn thấy dữ liệu đi từ source về kho dữ liệu
- Hiểu cấu trúc API, file, và dữ liệu bán cấu trúc
- Xây dựng pipeline đơn giản từ đầu đến cuối
Mục tiêu không phải viết code phức tạp,
mà là hiểu dữ liệu được tạo, xử lý và lưu trữ như thế nào.
4.4. SQL & data modeling: tạo ra dữ liệu dùng được cho analyst
SQL là công cụ chính của Analytics Engineer.
Nhưng SQL chỉ thực sự có ý nghĩa khi bạn:
- Biết dữ liệu dùng cho ai
- Biết bảng nào phục vụ câu hỏi nào
- Biết vì sao cần fact, dimension, và mô hình dữ liệu rõ ràng
Data modeling giúp:
- Dữ liệu nhất quán
- Dễ dùng
- Dễ mở rộng
Đây chính là phần cầu nối giữa kỹ thuật và business.
5. Lộ trình này phù hợp với ai – và không phù hợp với ai?
Phù hợp nếu bạn:
- Chưa có nền tảng IT hoặc data
- Muốn làm việc với dữ liệu ở góc nhìn analytics
- Quan tâm đến cách dữ liệu được tổ chức và sử dụng trong doanh nghiệp
- Muốn xây nền tảng vững thay vì học rời rạc
Không phù hợp nếu bạn:
- Muốn học nhanh để chuyển việc gấp
- Mục tiêu chính là AI / Machine Learning
- Chỉ muốn học tool mà không quan tâm bức tranh tổng thể
6. Kết luận: Analytics Engineer là vai trò cần học đúng ngay từ đầu
Analytics Engineer không phải là “Data Analyst nâng cao”, cũng không phải là “Data Engineer nhẹ hơn”.
Đây là một vai trò độc lập, đứng giữa Data Engineer và Data Analyst, và chịu trách nhiệm cho lớp dữ liệu phục vụ phân tích.
Nếu bạn chọn đi theo hướng này, điều quan trọng nhất không phải là học bao nhiêu tool, mà là hiểu mình đang xây gì và xây cho ai.

![[Khoá học] Analytics Engineer K2](https://blog.onhandbi.com/content/images/2026/01/1---syllabus-v2.png)