Theo một báo cáo mới được công bố tại Diễn đàn Kinh tế Thế giới, những thay đổi về nhân khẩu học và tiến bộ kỹ thuật có thể dẫn đến việc 5 triệu việc làm sẽ biến mất vào năm 2020. Tuy nhiên, ngược lại có một số công việc lại được dự đoán sẽ có sự tăng trưởng đáng kể, trong đó có nghề phân tích dữ liệu.

Xem thêm: Chọn nghề phân tích dữ liệu?
Nếu các bạn có theo dõi các bài viết trước của Big Data Uni về Chatbot thì cũng đã biết sự cần thiết và tầm quan trọng của hệ thống trả lời tự động ứng dụng trong mọi lĩnh vực, với mục đích quản lý hiệu quả các hoạt động tạo dựng, duy trì mối quan hệ với khách hàng đồng thời thu hút họ mua sản phẩm và đăng ký sử dụng dịch vụ.

Xem thêm: CÁC CHỈ SỐ KPI ĐÁNH GIÁ CHATBOT
Ở các bài viết trước, chúng tôi đã giới thiệu về khái niệm Chatbot và cách thức vận hành cũng như những phương pháp áp dụng cho quá trình phát triển Chatbot. Ở bài viết lần này, chúng tôi sẽ trình bày các lợi ích của Chatbot đem lại cho khách hàng và các công ty hoạt động kinh doanh.

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 3): LỢI ÍCH CỦA CHATBOT
Khoa học phân tích dữ liệu là một nhánh rẽ quan trọng trong lĩnh vực công nghệ thông tin. Nó sớm bộc lộ những tiềm lực quan trọng thúc đẩy sự phát triển của thế giới. Với sự phát triển nhanh chóng và lan rộng của mình, ngành Khoa học Dữ liệu đặc biệt thu hút sự quan tâm của các chuyên gia Việt Nam và cả trên khắp thế giới.

Xem thêm: Khoa học phân tích dữ liệu – Góc nhìn từ Việt Nam và Thế Giới
Thị trường E-commerce cùng với sự ra đời của những thành quả Cách mạng công nghiệp 4.0 như Artificial Intelligent (trí tuệ nhân tạo AI), Machine Learning (học máy) và đặc biệt là Big Data đã thay đổi một cách chóng mặt từ cách thức tiếp cận khách hàng cho đến cách thức quản lý, phân phối sản phẩm hàng hóa thông qua các webstie, app thông minh,..

Xem thêm: ỨNG DỤNG BIG DATA TRONG LĨNH VỰC E-COMMERCE (PHẦN 1)
Thương mại điện tử không chỉ tận hưởng những lợi ích của việc điều hành trực tuyến mà còn phải đối mặt với nhiều thách thức để đạt được các mục tiêu kinh doanh. Lý do là bởi các doanh nghiệp dù là nhỏ hay lớn, khi đã tham gia vào thị trường này đều cần đầu tư mạnh để cải tiến công nghệ.

Xem thêm: Giải pháp Big data cho Thương Mại Điện Tử
Ở các phần trước trong chủ đề về Statistics (thống kê) đã giới thiệu đến các bạn các khái niệm, lợi ích, ứng dụng của thống kê, đặc biệt Descriptive statistics (thống kê mô tả), một trong 2 dạng cơ bản của Statistics. Trở lại với bài viết lần này chúng tôi sẽ trình bày tóm tắt về dạng còn lại, chính là một số kiến thức của Inferential Statistics hay còn gọi là thống kê suy luận.

Xem thêm: TỔNG QUAN VỀ STATISTICS: INFERENTIAL STATISTICS (THỐNG KÊ SUY LUẬN)
Big Data có thể tạo ra các phương pháp tiếp cận dựa trên dữ liệu sáng tạo để dạy học sinh. Ở nhiều nước, việc ứng dụng Big Data trong trường học và cao đẳng đã dần trở nên phổ biến. Nhưng các nước đang phát triển cũng bắt đầu nghiên cứu để ứng dụng trong các hoạt động giảng dạy.

Xem thêm: Giải pháp Big data cho lĩnh vực Giáo Dục
Tìm hiểu về mối quan hệ giữa Big Data và Cloud
Việc tận dụng và khai thác Big Data để phục vụ cho mục đích cải thiện hiệu quả hoạt động kinh doanh ở mỗi công ty ngày càng trở nên quan trọng và đem lại lợi ích cực kỳ to lớn. Big Data được xem là tài sản cực kỳ chủ lực không thuộc tài chính và nhân lực, nên tài nguyên này cũng cần được quản lý và sử dụng đúng cách.

Xem thêm: BIG DATA VÀ CLOUD – SỰ KẾT HỢP HOÀN HẢO
Data visualization tạm được dịch là trực quan hóa dữ liệu, đây là phương pháp không chỉ là bước quan trọng của bất kỳ quy trình phân tích, hay khai phá dữ liệu mà nó còn là công cụ được sử dụng phổ biến và rộng rãi ở mọi tổ chức thuộc mọi lĩnh vực, hay bởi mỗi một ai trong chúng ta, với mục đích đơn giản là truyền đạt, trình bày một cách hiệu quả, đơn giản, thu hút những thông tin, dữ liệu đến người đọc, người xem.

Xem thêm: TỔNG QUAN VỀ DATA VISUALIZATION (TRỰC QUAN HÓA DỮ LIỆU)
Nếu các bạn có theo dõi những bài viết của chúng tôi về Data management (quản lý dữ liệu) và Data quality (chất lượng dữ liệu), thì chắc cũng biết tầm quan trọng của quá trình Data security; sự ra đời của những bộ luật, điều luật về bảo mật thông tin, dữ liệu như GDPR tại châu Âu, luật An ninh Mạng ở nước ta; đặc biệt là xu hướng khách hàng đang ngày càng quan tâm hơn về tính minh bạch trong việc sử dụng, và khả năng bảo vệ nguồn dữ liệu, thông tin cá nhân của họ tại các công ty.

Xem thêm: THỰC TRẠNG DATA SECURITY TRÊN TOÀN CẦU
Để thành công và phát triển, một công ty cần phải có khả năng đạt được, giữ chân, thỏa mãn và thu hút càng nhiều khách hàng càng tốt. Hiểu rõ hơn về khách hàng thông qua phân tích dữ liệu khách hàng vừa là công việc, nhiệm vụ rất quan trọng vừa là cơ sở để đánh giá công ty hoạt động hiệu quả như thế nào.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.2) LỢI ÍCH CỦA DỮ LIỆU KHÁCH HÀNG
Giới thiệu về K – nearest neighbor (KNN)
Ở các bài viết trước đã giới thiệu đến các bạn một cách tổng quan những chủ đề về Data mining (Khai phá dữ liệu), Predictive analytics (Phân tích dự báo), Statistics (Thống kê) bao gồm các khái niệm quan trọng, kỹ thuật phân tích và ứng dụng, lợi ích trong các lĩnh vực khác nhau.

Xem thêm: THUẬT TOÁN KNN VÀ VÍ DỤ ĐƠN GIẢN TRONG NGÀNH NGÂN HÀNG
Việc quyết định phương pháp đầu tư kinh doanh của công ty là một vấn đề khá phức tạp, đặc biệt khi bạn không chắc chắn những yếu tố nào cần dựa vào chỉ tiêu doanh thu, đánh giá của khách hàng, phản hồi nhóm hoặc thậm chí là cảm nhận từ chính bạn.
Xem thêm: Những điều cần biết về phân tích dữ liệu đối với kinh doanh
Từ khi có ứng dụng data science, ngành y tế và chăm sóc sức khỏe cũng có những bước nhảy vọt quan trọng. 5 nhóm lĩnh vực data science đã áp dụng thành công những ứng dụng của data science có thể kể đến như Phân tích hình ảnh y khoa, gien và bộ gien, Điều chế thuốc, phân tích và chẩn đoán, ứng dụng phần mềm sức khỏe hay trợ lý sức khỏe tâm lý.

Xem thêm: Ứng dụng Data Science vào lĩnh vực Y tế mang tính đột phá
Một dự án lớn đang được tiến hành ở cả Anh và Mỹ nhằm thu thập thông tin thông qua một khối lượng lớn dữ liệu bệnh nhân. Đây là một dự án đầy hứa hẹn nhằm tối ưu hóa giá trị sử dụng thuốc, từ việc xác định sự kém tuân thủ trong điều trị để nâng cao chất lượng kê đơn.

Xem thêm: Dữ liệu lớn Big data và Tương lai của ngành Dược?
Trở lại với chủ đề bài viết về Data mining, ở 2 phần trước đã giới thiệu dến các bạn khái niệm, tầm quan trọng, lợi ích, thách thức và đặc biệt là ứng dụng của Data mining trong nhiều lĩnh vực khác nhau. Phần cuối của chủ đề Data mining lần này, sẽ phân tích về các quy trình, kỹ thuật và thuật toán của Data mining, hay tìm hiểu làm cách Data mining khai thác giá trị, những thông tin hữu ích từ dữ liệu?

Xem thêm: TỔNG QUAN VỀ DATA MINING (P3): QUÁ TRÌNH VÀ PHƯƠNG PHÁP
Giá trị khách hàng suốt vòng đời – Customer lifetime value
Một trong những khái niệm mà bất kể chuyên gia tiếp thị marketing hay chủ doanh nghiệp cần để ý là giá trị của khách hàng trong suốt vòng đời của họ. Điều này đặc biệt quan trọng khi đề ra chiến lượt tiếp thị marketing, định vị thương hiệu của mỗi nhãn hàng ( brand).Cụ thể hơn là khi đưa ra quyết định, tính toán về chi phí quảng cáo marketing cho mỗi khách hàng và ngân sách cho các chiến dịch tiếp thị marketing.

Xem thêm: Giá trị suốt vòng đời của khách hàng – Customer lifetime value
Bối cảnh, nguyên nhân tại sao các công ty ngày nay cần định hướng dữ liệu (Data – driven)
Nếu các bạn có theo dõi những các bài viết trước đây của thì chúng tôi đã đề cập nhiều về tầm quan trọng của dữ liệu – được coi là nguồn sống của mọi tổ chức trong thời đại 4.0 – cũng như các xu hướng của Big Data, Data Analytics, và nhu cầu khai thác dữ liệu để đạt được giá trị, lợi ích trong kinh doanh ngày càng được quan tâm hơn.

Xem thêm: CÔNG TY ĐỊNH HƯỚNG DỮ LIỆU (DATA – DRIVEN ENTERPRISE) (PHẦN 1)
Đây là một trong những lĩnh vực sử dụng Big data công khai và lớn nhất hiện nay. Big data được sử dụng để hiểu rõ hơn về khách hàng cũng như hành vi và sở thích của họ. Các công ty rất muốn mở rộng bộ dữ liệu truyền thông của họ, dữ liệu truyền thông xã hội, nhật ký trình duyệt cũng như phân tích văn bản, dữ liệu cảm biến. Để có được bức tranh đầy đủ hơn về khách hàng của họ. Mục tiêu lớn hơn, trong nhiều trường hợp, là tạo ra các mô hình dự đoán.

Xem thêm: Giải pháp Big data giúp hiểu Khách Hàng Mục Tiêu
Trở lại với chủ đề bài viết về phân tích dự báo – Predictive analytics, ở phần 1, đã giới thiệu đến các bạn thế nào là phân tích dự báo, phân biệt nó với Data analytics, Descriptive analytics (phân tích mô tả) và Prescriptive analytics (phân tích đề xuất), còn phần 2 lần này chúng tôi sẽ đi vào trình bày một cách tổng quan về bản chất, cách thức vận hành, quy trình, và các thuật toán hay kỹ thuật phân tích được sử dụng trong Predictive analytics.

Xem thêm: TỔNG QUAN VỀ PREDICTIVE ANALYTICS (PHÂN TÍCH DỰ BÁO) (PHẦN 2)
Big data là gì? Công nghệ dữ liệu lớn là gì? Phân tích dữ liệu lớn là gì? Mang lại lợi ích như thế nào? Ứng dụng của Big Data trong thời đại công nghệ 4.0 là gì?
Các công ty công nghệ lớn hiện nay tại sao lại cần và ứng dụng Big Data nhiều đến vậy? Những cơ hội và thách thức khi ứng dụng Big Data là gì?
Hẳn là bạn đã từng giật mình khi bạn tìm kiếm thông tin nào đó trên Google. Mua sắm ở các trang thương mại trực tuyến và nhận thấy các trang này.

Xem thêm: Big Data công nghệ biến “sắt” thành mỏ “vàng”, Cơ hội và thách thức
Dữ liệu lớn có ở rất nhiều tổ chức, nhiều hoạt động xã hội, kinh doanh, khoa học và tiềm ẩn nhiều giá trị to lớn. Việc đó đồng nghĩa với các nhà khoa học phải đau đầu khi đối phó với việc lưu trữ, xử lý khối lượng số liệu khổng lồ và đa dạng về chủng loại dữ liệu.

Xem thêm: Big data với những vấn đề, giải pháp & thách thức
Trở lại với chủ đề bài viết về thuật toán cây quyết định, ở bài viết trước đã giới thiệu đến các bạn tổng quan thế nào là Decision Tree, các công thức quan trọng để xác định cách phân nhánh tối ưu hay nói cách khác là đem lại kết quả phân loại (classification) chính xác dựa trên các thuộc tính dữ liệu và đặc biệt là thuật toán CART (classification and regression tree) sử dụng công thức “Goodness of Split”.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.2): CART (GINI INDEX)
Trở lại với chủ đề về thống kê, ở phần trước chúng tôi đã giới thiệu đến các bạn các khái niệm về thống kê cũng như lợi ích và ứng dụng của nó, tiếp theo ở phần này, chúng tôi sẽ đề cập đến một mảng kiến thức quan trọng khác đó chính Descriptive statistics (thống kê mô tả)

Xem thêm: TỔNG QUAN VỀ STATISTICS: DESCRIPTIVE STATISTICS (THỐNG KÊ MÔ TẢ)
Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES
Tầm quan trọng của Big Data (Dữ liệu lớn) và sự nhận thức về giá trị của nó giảm dần, nhiều công ty đầu tư vào lĩnh vực này nhưng không đem lại kỳ vọng, và kết quả tốt lợi. Nguyên nhân do nhu cầu và tính chất phức tạp của hệ thống công nghệ kỹ thuật phải xây dựng, bảo trì, chi phí lại cao, thiếu nguồn nhân lực có chuyên môn sâu, và kỹ năng về lĩnh vực Data Science hay Data Analytics,…

Xem thêm: TỔNG QUAN VỀ BIG DATA TRÊN TOÀN CẦU
Phân tích dữ liệu dự đoán đang nhanh chóng trở thành động lực thúc đẩy tiếp thị hiện đại. Phân tích dữ liệu dự đoán là quá trình sử dụng dữ liệu lịch sử và hiện tại kết hợp với học máy để dự báo một số kết quả nhất định.

Xem thêm: 6 cách phân tích dữ liệu dự đoán đang định hình lại marketing
Ở bài viết trước, chúng tôi đã giới thiệu sơ lược về Chatbot về khái niệm cũng như cách thức vận hành đơn giản nhất của Chatbot. Lần này, chúng tôi sẽ cung cấp cho các bạn về các phương pháp, thuật toán là cơ sở hoạt động của Chatbot hay nói cách khác Chatbot hoạt động ra sao?

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 2): CHATBOT HOẠT ĐỘNG NHƯ THẾ NÀO?
Ở phần 1 bài viết cùng chủ đề, đã giới thiệu các khái niệm về Data quality, Data quality management; lợi ích; tầm quan trọng; và các tiêu chuẩn, tiêu chí đánh giá chất lượng dữ liệu. Mặc dù nhiều công ty, tổ chức hiện nay đã nhận thức được sự cần thiết của các nhiệm vụ trong Data quality, nhưng họ vẫn phải đối mặt với nhiều thách thức, khó khăn khác nhau dẫn đến việc thiết lập, và triển khai các giải pháp thích hợp càng được quan tâm hơn bao giờ hết.

Xem thêm: TỔNG QUAN VỀ DATA QUALITY – CHẤT LƯỢNG DỮ LIỆU (P2)
KHI MỘT CHUYÊN GIA PHÂN TÍCH DỮ LIỆU NHẬN ĐƯỢC YÊU CẦU TỪ CÁC PHÒNG BAN, BỘ PHẬN HAY LÃNH ĐẠO CÔNG TY, CHUYÊN GIA ẤY CÓ THỂ NHẢY VÀO PHÂN TÍCH NGHIÊN CỨU NGAY VẤN ĐỀ. NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU SẼ MONG MUỐN TỪ YÊU CẦU ĐƠN GIẢN BAN ĐẦU SẼ TÌM RA PHÁT HIỆN TUYỆT VỜI, ĐƯA RA ĐƯỢC CÁC ĐỀ XUẤT HAY NHẤT ĐỂ ÁP DỤNG CHO CÔNG TY. NHƯNG THỰC TẾ THƯỜNG KHÔNG THUẬN LỢI NHƯ VẬY.

Xem thêm: Các bước chuẩn bị cho một dự án phân tích dữ liệu thành công!
Quay trở lại với chủ đề về dữ liệu khách hàng, ở bài viết phần 1 và phần 2, đã giới thiệu đến các bạn những khái niệm về phân tích dữ liệu khách hàng, loại dữ liệu khách hàng có thể thu thập, và lợi ích, cũng như mục đích của quá trình Customer data analytics. Trong phần 3 lần này, chúng tôi sẽ cung cấp những giải pháp hỗ trợ các công ty khai thác nguồn dữ liệu khách hàng của họ sao cho hiệu quả nhất.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.3) GIẢI PHÁP KHAI THÁC CUSTOMER DATA HIỆU QUẢ
Hội thảo Quốc tế về Thống kê Du lịch do Liên Hợp Quốc (UN) tổ chức vào cuối tháng 6, 2017 tại Manilla, Phillippines đã nhấn mạnh tới cách các thành phố sử dụng công nghệ Dữ liệu lớn (Big Data) để quản lý du lịch tốt hơn.

Xem thêm: Câu chuyện Dữ liệu lớn và ngành du lịch
Dịch vụ dữ liệu chính xác, tin cậy , đúng mục tiêu , đúng nhu cầu cho lĩnh vực du lịch, lữ hành, team-building,...
Ngoài ra chúng tôi còn có sẵn data địa điểm rất hữu ích cho các dự án khởi nghiệp về du lịch, địa điểm, mạng xã hội du lịch, ...

Xem thêm: Dịch vụ và giải pháp Big Data cho lĩnh vực du lịch
Big Data ngày càng được sử dụng để tối ưu hóa các quy trình kinh doanh. Các nhà bán lẻ có thể tối ưu hóa cổ phiếu của họ dựa trên dự đoán. Từ dữ liệu truyền thông xã hội, xu hướng tìm kiếm trên web và dự báo thời tiết.

Xem thêm: Giải Pháp Big Data Tối ưu hóa quy trình kinh doanh
Dữ liệu khách hàng hay Customer data được coi là tài sản, nguồn thông tin vô giá đối với mọi công ty thuộc nhiều lĩnh vực kinh doanh khác nhau. Việc triển khai các quy trình khai thác, dự án nghiên cứu, phân tích Customer data với mục đích tìm hiểu, nắm bắt mong muốn, nhu cầu thầm kín của khách hàng, và chuyển nó thành những giá trị cụ thể thông qua từng chiến lược, kế hoạch hoạt động chính là chìa khóa cạnh tranh của mỗi tổ chức ngày nay.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.1) – DỮ LIỆU KHÁCH HÀNG LÀ GÌ?
Hàn Quốc tự hào là nước có ngân hàng dữ liệu quốc gia về sức khoẻ của toàn bộ người dân. Hiện nay, Hàn Quốc đã bắt đầu nghiên cứu ứng dụng “Y học chính xác” hay “Y học cá thể” từ kho dữ liệu lớn về sức khoẻ của quốc gia. Tại quốc gia này, dữ liệu sức khoẻ của người dân được chia làm 6 nhóm dữ liệu.

Dữ liệu gen và SDOH là đầu vào của tình trạng sức khỏe, dữ liệu lâm sàng và PGHD là đầu ra của tình trạng sức khỏe
Xem thêm: Tìm hiểu các loại dữ liệu sức khoẻ của “Big data” tại Hàn Quốc
TTCT - College Board, tổ chức phi lợi nhuận đang phụ trách kỳ thi SAT, đã bán mỗi cái tên thí sinh kèm theo các thông tin liên quan với giá 47 cent (khoảng 11.000 đồng), gây ra những tranh cãi dữ dội về tuyển sinh đại học ở Mỹ.
với khát vọng là công ty đi đầu trong lĩnh vực khai phá dữ liệu Big Data, và tư vấn chiến lược trong tương lai, sẵn sàng hỗ trợ, đồng hành cùng bạn – dù bạn là ai – trên con đường khai phá Big Data. Nhưng trước hết công ty giới thiệu các bước khai thác Big Data. Theo SAS, các bước khai phá Big Data bao gồm:

Xem thêm: THÁCH THỨC TRONG QUÁ TRÌNH KHAI THÁC DỮ LIỆU BIG DATA
Tại Việt Nam, kho dữ liệu còn rất hạn chế, muốn nghiên cứu phải đòi hỏi nền tảng công nghệ rất lớn. Tuy nhiên, để phục vụ người dân tốt hơn thì việc xây dựng dữ liệu lớn (big data) là việc cần thiết, phải đẩy mạnh triển khai trong thời gian tới.

Nhiều doanh nghiệp Việt Nam chưa xây dựng big data trong hoạt động sản xuất, kinh doanh và quản trị doanh nghiệp
Xem thêm: Việt Nam còn thiếu big data?