Skip to content

huynhtloi/Mining-Of-Massive-Datasets

Repository files navigation

Xử lý dữ liệu lớn

Mục tiêu của môn học

  • Người học hiểu và vận dụng được các kỹ thuật khai phá các loại dữ liệu khác nhau (dữ liệu nhiều chiều, dữ liệu dạng đồ thị, …) bằng cách sử dụng các mô hình tính toán trên dữ liệu lớn và thời gian thực (MapReduce, giải thuật xử lý luồng dữ liệu, …) nhằm giải quyết các vấn đề trong thực tế.
  • Hình thành những kỹ năng cơ bản ứng dụng mô hình MapReduce và các kỹ thuật xử lý dữ liệu để giải quyết các bài toán trong thực tế.
  • Người học phải nắm vững và vận dụng được mô hình MapReduce.
  • Người học được rèn luyện khả năng phân tích và làm việc độc lập dưới sự giám sát của giảng viên.

Tóm tắt nội dung môn học

  • Người học được trang bị kiến thức về khai phá các kiểu dữ liệu khác nhau (dữ liệu nhiều chiều, dữ liệu đồ thị, dữ liệu vô hạn, dữ liệu có gán nhãn) bằng các mô hình tính toán trên dữ liệu lớn (MapReduce, giải thuật xử lý luồng dữ liệu trực tuyến), từ đó, làm cơ sở để giải quyết các vấn đề trong thực tế như hệ thống khuyến nghị, phân tích thị trường, phát hiện văn bản trùng lắp, …. Bên cạnh đó, người học được dạy các kỹ thuật toán học và lập trình như đại số tuyến tính, quy hoạch động, phương pháp băm, ….
  • Từ các kiến thức học được, khi tiếp cận với bài toán có dữ liệu lớn, người học phải có khả năng phân tích và áp dụng mô hình MapReduce để xử lý dữ liệu, tìm lời giải bài toán.