Analytics Engineer là ai?

Analytics Engineer là ai?

Phong Nguyen
1/13/2026 5 min read

Analytics Engineer: Vai trò ở giữa Data Engineer và Data Analyst – và vì sao người mới cần một lộ trình đúng

Trong vài năm gần đây, khi tìm hiểu về data, bạn có thể nghe đến rất nhiều vai trò khác nhau: Data Analyst, Data Engineer, Data Scientist.
Và rồi xuất hiện thêm một cái tên mới: Analytics Engineer.

Với người mới hoặc người chuyển ngành, điều này thường gây bối rối:

  • Analytics Engineer là ai?
  • Khác gì với Data Analyst?
  • Có phải là một bước đệm sang Data Scientist không?

Bài viết này không nhằm “quảng bá” một vai trò mới.
Mục tiêu của nó là giải thích đúng bản chất Analytics Engineer, và vì sao nếu học sai ngay từ đầu, người mới rất dễ lạc hướng.


1. Analytics Engineer là ai – và họ đứng ở đâu trong team data?

Trong một team data điển hình, thường có ba vai trò chính:

  • Data Engineer
    Tập trung vào việc đưa dữ liệu từ các hệ thống khác nhau (app, website, CRM, ads…) về kho dữ liệu.
    Công việc của họ liên quan nhiều đến ingestion, hạ tầng, độ ổn định và hiệu năng.

  • Data Analyst
    Sử dụng dữ liệu để trả lời câu hỏi kinh doanh, tạo báo cáo, dashboard và insight cho business.

Vấn đề nằm ở chỗ:

Dữ liệu mà Data Engineer đưa về thường chưa sẵn sàng để Data Analyst sử dụng ngay.

Nó có thể:

  • Chưa thống nhất logic
  • Chưa được tổ chức theo góc nhìn business
  • Mỗi bảng một kiểu, mỗi metric một cách tính

Analytics Engineer xuất hiện để lấp khoảng trống đó.

Họ đứng giữa Data Engineer và Data Analyst:

  • Không làm hạ tầng phức tạp như Data Engineer
  • Không làm phân tích ad-hoc như Data Analyst

Công việc cốt lõi của Analytics Engineer là:

Biến dữ liệu thô thành dữ liệu có cấu trúc, nhất quán,
và có thể dùng lâu dài cho phân tích.


2. Vì sao vai trò này ngày càng quan trọng?

Khi công ty còn nhỏ, Data Analyst có thể:

  • Viết query trực tiếp trên dữ liệu thô
  • Tự xử lý logic trong từng báo cáo

Nhưng khi dữ liệu lớn dần:

  • Mỗi analyst viết một logic khác nhau
  • Cùng một chỉ số nhưng mỗi dashboard ra một con số
  • Business bắt đầu mất niềm tin vào dữ liệu

Analytics Engineer giải quyết vấn đề này bằng cách:

  • Chuẩn hóa logic business
  • Tổ chức dữ liệu theo mô hình rõ ràng
  • Tạo ra các bảng dữ liệu “analytics-ready”

Nhờ đó:

  • Data Analyst tập trung vào phân tích thay vì dọn dữ liệu
  • Business dùng chung một nguồn số liệu
  • Dữ liệu trở thành tài sản, không phải gánh nặng

3. Vì sao người mới học data thường bị lạc hướng?

Rất nhiều người mới bắt đầu học data theo cách:

  • Học SQL trước
  • Học Python trước
  • Học tool trước

Nhưng sau một thời gian, họ gặp cảm giác:

  • Biết cú pháp nhưng không hiểu dùng để làm gì
  • Viết được query nhưng không biết đang phục vụ ai
  • Không hình dung được dữ liệu trong công ty vận hành ra sao

Nguyên nhân không phải vì họ thiếu khả năng.
Nguyên nhân là họ học kỹ thuật trước khi hiểu vai trò và bối cảnh.

Với Analytics Engineer, điều này càng nguy hiểm:

  • Nếu không hiểu vị trí “ở giữa”
  • Bạn sẽ học lệch sang:
    • Hạ tầng quá sâu
    • Hoặc phân tích quá vụn vặt

4. Tư duy thiết kế một lộ trình học Analytics Engineer cho người mới

Một lộ trình hợp lý cho người trái ngành không nên bắt đầu từ tool.

4.1. Bắt đầu từ mindset: dữ liệu dùng để làm gì?

Trước khi học bất kỳ ngôn ngữ nào, người học cần hiểu:

  • Dữ liệu phục vụ quyết định kinh doanh như thế nào?
  • Một chỉ số business được tạo ra từ dữ liệu ra sao?
  • Vì sao “dữ liệu đúng” quan trọng hơn “query chạy được”?

Đây là nền tảng tư duy cho mọi bước sau.


4.2. Hiểu business & dữ liệu trước khi học code

Analytics Engineer không làm việc với dữ liệu trừu tượng.
Họ làm việc với:

  • Dữ liệu marketing
  • Dữ liệu bán hàng
  • Dữ liệu hành vi người dùng

Người học cần hiểu:

  • Mỗi hoạt động business tạo ra dữ liệu gì
  • Dữ liệu thô khác gì dữ liệu phục vụ phân tích
  • Vì sao cần chuẩn hóa và mô hình hóa dữ liệu

4.3. Dùng Python để hiểu pipeline, không phải để làm developer

Python trong lộ trình này được dùng để:

  • Nhìn thấy dữ liệu đi từ source về kho dữ liệu
  • Hiểu cấu trúc API, file, và dữ liệu bán cấu trúc
  • Xây dựng pipeline đơn giản từ đầu đến cuối

Mục tiêu không phải viết code phức tạp,
mà là hiểu dữ liệu được tạo, xử lý và lưu trữ như thế nào.


4.4. SQL & data modeling: tạo ra dữ liệu dùng được cho analyst

SQL là công cụ chính của Analytics Engineer.
Nhưng SQL chỉ thực sự có ý nghĩa khi bạn:

  • Biết dữ liệu dùng cho ai
  • Biết bảng nào phục vụ câu hỏi nào
  • Biết vì sao cần fact, dimension, và mô hình dữ liệu rõ ràng

Data modeling giúp:

  • Dữ liệu nhất quán
  • Dễ dùng
  • Dễ mở rộng

Đây chính là phần cầu nối giữa kỹ thuật và business.


5. Lộ trình này phù hợp với ai – và không phù hợp với ai?

Phù hợp nếu bạn:

  • Chưa có nền tảng IT hoặc data
  • Muốn làm việc với dữ liệu ở góc nhìn analytics
  • Quan tâm đến cách dữ liệu được tổ chức và sử dụng trong doanh nghiệp
  • Muốn xây nền tảng vững thay vì học rời rạc

Không phù hợp nếu bạn:

  • Muốn học nhanh để chuyển việc gấp
  • Mục tiêu chính là AI / Machine Learning
  • Chỉ muốn học tool mà không quan tâm bức tranh tổng thể

6. Kết luận: Analytics Engineer là vai trò cần học đúng ngay từ đầu

Analytics Engineer không phải là “Data Analyst nâng cao”, cũng không phải là “Data Engineer nhẹ hơn”.

Đây là một vai trò độc lập, đứng giữa Data Engineer và Data Analyst, và chịu trách nhiệm cho lớp dữ liệu phục vụ phân tích.

Nếu bạn chọn đi theo hướng này, điều quan trọng nhất không phải là học bao nhiêu tool, mà là hiểu mình đang xây gì và xây cho ai.