Tất cả chúng ta đang đều sống và làm việc trong thời đại công nghệ hiện đại nó đang làm thay đổi toàn bộ cục diện của tất cả hầu hết các lĩnh vực kinh tế, xã hội, y tế, quốc phòng,..
Xem thêm: BIG DATA – THÀNH QUẢ CỦA CÁCH MẠNG CÔNG NGHỆ HIỆN ĐẠI
Tất cả chúng ta đang đều sống và làm việc trong thời đại công nghệ hiện đại nó đang làm thay đổi toàn bộ cục diện của tất cả hầu hết các lĩnh vực kinh tế, xã hội, y tế, quốc phòng,..
Xem thêm: BIG DATA – THÀNH QUẢ CỦA CÁCH MẠNG CÔNG NGHỆ HIỆN ĐẠI
Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.
Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES
Sự phát triển của ngành ngân hàng (Banking) đi đôi với sự ra đời của Big Data
Ngành ngân hàng đã phát triển theo bước nhảy vọt trong thập kỷ qua từ hoạt động vận hành kinh doanh đến cung cấp dịch vụ. Điều đáng ngạc nhiên chính là, hầu hết các ngân hàng đều gặp khó khăn hay thất bại trong việc sử dụng, khai thác thông tin, dữ liệu từ cơ sở dữ liệu (database) mà họ có được từ khách hàng và từ các chi nhánh, bộ phận của tổ chức.
Xem thêm: ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC NGÂN HÀNG (PHẦN 1)
Ngày nay, khi nhiều tổ chức đẩy mạnh tiếp cận dữ liệu, và cho rằng dữ liệu là nguồn lực quan trọng để phát triển, thì Data quality – chất lượng dữ liệu – càng được quan tâm và chú ý hơn. Theo Gartner (công ty hàng đầu thế giới chuyên về tư vấn và nghiên cứu), dữ liệu có chất lượng thấp sẽ ảnh hưởng tiêu cực đến năng suất, lợi nhuận của mỗi tổ chức đặc biệt khi mọi hành động, quyết định, chiến lược đều dựa vào dữ liệu.
Xem thêm: TỔNG QUAN VỀ DATA QUALITY – CHẤT LƯỢNG DỮ LIỆU (P1)
Để thành công và phát triển, một công ty cần phải có khả năng đạt được, giữ chân, thỏa mãn và thu hút càng nhiều khách hàng càng tốt. Hiểu rõ hơn về khách hàng thông qua phân tích dữ liệu khách hàng vừa là công việc, nhiệm vụ rất quan trọng vừa là cơ sở để đánh giá công ty hoạt động hiệu quả như thế nào.
Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.2) LỢI ÍCH CỦA DỮ LIỆU KHÁCH HÀNG
Ngành công nghiệp du lịch và lữ hành đang đối mặt với thách thức bán đúng sản phẩm đến đúng đối tượng khách hàng vào thời điểm chính xác và giữ đúng giá ở đúng kênh. Tất cả điều này đòi hỏi dữ liệu nội bộ lẫn bên ngoài. Dữ liệu nội bộ như kỳ vọng của khách hàng trong quá khứ, tỷ lệ hết vé, doanh thu phòng và tình trạng đặt vé hiện tại. Dữ liệu bên ngoài gồm sự kiện, thời tiết, những chuyến bay và những kỳ nghỉ.
Nếu các bạn đã theo dõi các bài viết của Big Data Uni thì chắc cũng đã nắm được tổng quan về Big Data bao gồm khái niệm, lợi ích và ứng dụng của nó trong nhiều lĩnh vực khác nhau. Trong chủ đề bài viết lần này và sắp tới, chúng tôi sẽ không đề cập về những giá trị mà Big Data đem lại mà đi vào trọng tâm một trong những công cụ, quá trình quan trọng nhất đối với mỗi dự án Big Data đó chính là Data mining (hay còn gọi là khai phá dữ liệu).
Xem thêm: TỔNG QUAN VỀ DATA MINING (P1): KHAI PHÁ DỮ LIỆU LÀ GÌ?
Như ta đã biết, hệ thống phân tích kinh doanh thông minh (BI) không chỉ là phần mềm. Để triển khai thành công hệ thống BI, doanh nghiệp cần phải có quy trình và cơ sở hạ tầng tốt bên cạnh việc lựa chọn đúng úng dụng phân tích kinh doanh thông minh (BI tools).
Xem thêm: Cách tốt nhất để thành công với hệ thống phân tích kinh doanh – BI (Business Intelligence)
Quay trở lại với chủ đề về Decision trees, thì ở 2 bài viết trước đã giới thiệu đến các bạn khái quát thế nào là thuật toán cây quyết định, bao gồm các thành phần, và một số công thức tính toán để lựa chọn các biến phân nhánh hay cách phân nhánh tối ưu, mục đích dự báo, phân loại, phân nhóm các đối tượng dữ liệu vào các nhóm, các lớp của biến mục tiêu sao cho chính xác nhất.
Murray Webb, 33 tuổi, tốt nghiệp thạc sĩ về thống kê ứng dụng (applied statistics) tại Trường Đại học Kennesaw (Atlanta, Mỹ), hiện kiếm được 160.000 đô la một năm với công việc chủ yếu là theo dõi phần thông tin về dữ liệu chăm sóc sức khỏe khách hàng cho các bệnh viện. Webb cho biết hằng tuần đều có người đại diện của các công ty cũng như các công ty chuyên cung cấp nguồn nhân lực tìm đến anh và đưa ra các lời mời làm việc như một nhà khoa học dữ liệu (data scientist).
KHI MỘT CHUYÊN GIA PHÂN TÍCH DỮ LIỆU NHẬN ĐƯỢC YÊU CẦU TỪ CÁC PHÒNG BAN, BỘ PHẬN HAY LÃNH ĐẠO CÔNG TY, CHUYÊN GIA ẤY CÓ THỂ NHẢY VÀO PHÂN TÍCH NGHIÊN CỨU NGAY VẤN ĐỀ. NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU SẼ MONG MUỐN TỪ YÊU CẦU ĐƠN GIẢN BAN ĐẦU SẼ TÌM RA PHÁT HIỆN TUYỆT VỜI, ĐƯA RA ĐƯỢC CÁC ĐỀ XUẤT HAY NHẤT ĐỂ ÁP DỤNG CHO CÔNG TY. NHƯNG THỰC TẾ THƯỜNG KHÔNG THUẬN LỢI NHƯ VẬY.
Xem thêm: Các bước chuẩn bị cho một dự án phân tích dữ liệu thành công!
Ở bài viết trước, phần 1 về ứng dụng Big Data trong lĩnh vực E-commerce, đã giới thiệu đến các bạn tổng quan về thị trường E-commerce, các định nghĩa, khái niệm về kinh doanh trực tuyến, đồng thời mô tả nguồn dữ liệu E-commerce có những đặc tính được coi là Big Data và nói lên nhu cầu khai thác.
Xem thêm: ỨNG DỤNG BIG DATA TRONG LĨNH VỰC E-COMMERCE (PHẦN 2)
Ở thời điểm nay, không phải tài sản vật chất, thiết bị máy móc hay cơ sở hạ tầng sản phẩm là tài sản lớn nhất của một doanh nghiệp, mà chính là khách hàng. Nếu bạn không thể làm hài lòng khách hàng và hiểu nhu cầu của họ, thì bạn sẽ không bao giờ trở thành chủ sở hữu của một doanh nghiệp thành công.
Xem thêm: Giải pháp Big data cho lĩnh vực Dịch Vụ Khách Hàng
Phân tích dữ liệu dự đoán đang nhanh chóng trở thành động lực thúc đẩy tiếp thị hiện đại. Phân tích dữ liệu dự đoán là quá trình sử dụng dữ liệu lịch sử và hiện tại kết hợp với học máy để dự báo một số kết quả nhất định.
Xem thêm: 6 cách phân tích dữ liệu dự đoán đang định hình lại marketing
Sự xuất hiện ngày càng nhiều các sản phẩm công nghệ, kỹ thuật số thông minh tiên tiến gia tăng tối đa trải nghiệm khách hàng cho thấy mức độ phổ biến và ứng dụng rộng rãi của Machine Learning để phát triển các sản phẩm AI (Artificial Intelligence – trí tuệ nhân tạo). Cũng chính các thay đổi cực kỳ lớn và thịnh hành của môi trường công nghệ đã tạo cơ hội, mở ra cánh cửa để Big Data thúc đẩy kinh tế, hỗ trợ các công ty cải thiện hiệu quả kinh doanh của mình thông qua khai thác giá trị tiềm ẩn, thông tin hữu ích từ dữ liệu.
Xem thêm: TOP CÁC XU HƯỚNG BIG DATA SẼ ĐI ĐẦU TRONG NĂM 2019 (PHẦN 1)
Giới thiệu về K – nearest neighbor (KNN)
Ở các bài viết trước đã giới thiệu đến các bạn một cách tổng quan những chủ đề về Data mining (Khai phá dữ liệu), Predictive analytics (Phân tích dự báo), Statistics (Thống kê) bao gồm các khái niệm quan trọng, kỹ thuật phân tích và ứng dụng, lợi ích trong các lĩnh vực khác nhau.
Xem thêm: THUẬT TOÁN KNN VÀ VÍ DỤ ĐƠN GIẢN TRONG NGÀNH NGÂN HÀNG
Khoa học dữ liệu đang dần khẳng định vai trò của mình trong việc cải thiện sức khỏe ngày nay. Big Data không chỉ được ứng dụng để xác định phương hướng điều trị mà giúp cải thiện quá trình chăm sóc sức khỏe. Từ khi Big Data được ứng dụng vào lĩnh vực chăm sóc sức khỏe, nó đã tạo nên nhiều tác động lớn trong việc giảm lãng phí tiền bạc và thời gian.
Việc quyết định phương pháp đầu tư kinh doanh của công ty là một vấn đề khá phức tạp, đặc biệt khi bạn không chắc chắn những yếu tố nào cần dựa vào chỉ tiêu doanh thu, đánh giá của khách hàng, phản hồi nhóm hoặc thậm chí là cảm nhận từ chính bạn.
Xem thêm: Những điều cần biết về phân tích dữ liệu đối với kinh doanh
Ở các bài viết trước, chúng tôi đã giới thiệu về khái niệm Chatbot và cách thức vận hành cũng như những phương pháp áp dụng cho quá trình phát triển Chatbot. Ở bài viết lần này, chúng tôi sẽ trình bày các lợi ích của Chatbot đem lại cho khách hàng và các công ty hoạt động kinh doanh.
Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 3): LỢI ÍCH CỦA CHATBOT
Big Data có thể tạo ra các phương pháp tiếp cận dựa trên dữ liệu sáng tạo để dạy học sinh. Ở nhiều nước, việc ứng dụng Big Data trong trường học và cao đẳng đã dần trở nên phổ biến. Nhưng các nước đang phát triển cũng bắt đầu nghiên cứu để ứng dụng trong các hoạt động giảng dạy.
Đa số các bạn nhảy vào phân tích dữ liệu ngay, trước khi bạn lên kế hoạch và mục tiêu của dự án phân tích dữ liệu. Và cũng tương tự như vậy, bạn có thể nhảy vào làm slide cho một buổi thuyết trình trong môi trường kinh doanh trước khi bạn lên kế hoạch cho thuyết trình đó. Và tất nhiên bạn sẽ kết quả là tốn rất nhiều thời gian cho slide mà không đạt được kết quả tốt nhất.
Xem thêm: Phương pháp thuyết trình đạt hiệu quả trong môi trường kinh doanh!
Hacker tối qua đã tung thông tin nghi là của hai triệu khách hàng từ một ngân hàng Việt Nam lên Raidforums, một website chuyên mua bán dữ liệu.
Các thông tin bị rò rỉ bao gồm tên đầy đủ, số chứng minh thư, số điện thoại, địa chỉ nhà, ngày tháng năm sinh, giới tính, email và nghề nghiệp.
Đây là một trong những lĩnh vực sử dụng Big data công khai và lớn nhất hiện nay. Big data được sử dụng để hiểu rõ hơn về khách hàng cũng như hành vi và sở thích của họ. Các công ty rất muốn mở rộng bộ dữ liệu truyền thông của họ, dữ liệu truyền thông xã hội, nhật ký trình duyệt cũng như phân tích văn bản, dữ liệu cảm biến. Để có được bức tranh đầy đủ hơn về khách hàng của họ. Mục tiêu lớn hơn, trong nhiều trường hợp, là tạo ra các mô hình dự đoán.
Trở lại với chủ đề Data security, bảo mật dữ liệu, ở phần 1 bài viết trước chúng ta đã cùng nhau tìm hiểu về thực trạng Data security trên toàn cầu thông qua bàn luận những số liệu từ các báo cáo, nghiên cứu của Verizon và IBM về Data breach (xâm phạm, đánh cắp, rò rỉ dữ liệu) tại những công ty, tổ chức đến từ nhiều quốc gia khác nhau; cũng như tìm hiểu tổng quan về Data security như khái niệm, lợi ích, thách thức.
Xem thêm: GIẢI PHÁP CẢI THIỆN BẢO MẬT DỮ LIỆU – DATA SECURITY
Thông thường, khi khối lượng của một tập dữ liệu rất lớn và không thể quản lý được như các cơ sở dữ liệu truyền thống, thì chúng ta có thể gọi nó là Big Data. Đến lúc này, đám mây cung cấp cơ sở hạ tầng cần thiết cho việc tính toán dữ liệu lớn. Trong cuộc sống thực, nhiều tổ chức đang kết hợp hai công nghệ này để cải thiện hoạt động điều phối kinh doanh của mình.
Trở lại với chủ đề về thống kê, ở phần trước chúng tôi đã giới thiệu đến các bạn các khái niệm về thống kê cũng như lợi ích và ứng dụng của nó, tiếp theo ở phần này, chúng tôi sẽ đề cập đến một mảng kiến thức quan trọng khác đó chính Descriptive statistics (thống kê mô tả)
Xem thêm: TỔNG QUAN VỀ STATISTICS: DESCRIPTIVE STATISTICS (THỐNG KÊ MÔ TẢ)
Khoa học phân tích dữ liệu là một nhánh rẽ quan trọng trong lĩnh vực công nghệ thông tin. Nó sớm bộc lộ những tiềm lực quan trọng thúc đẩy sự phát triển của thế giới. Với sự phát triển nhanh chóng và lan rộng của mình, ngành Khoa học Dữ liệu đặc biệt thu hút sự quan tâm của các chuyên gia Việt Nam và cả trên khắp thế giới.
Xem thêm: Khoa học phân tích dữ liệu – Góc nhìn từ Việt Nam và Thế Giới
Big data là gì? Công nghệ dữ liệu lớn là gì? Phân tích dữ liệu lớn là gì? Mang lại lợi ích như thế nào? Ứng dụng của Big Data trong thời đại công nghệ 4.0 là gì?
Các công ty công nghệ lớn hiện nay tại sao lại cần và ứng dụng Big Data nhiều đến vậy? Những cơ hội và thách thức khi ứng dụng Big Data là gì?
Hẳn là bạn đã từng giật mình khi bạn tìm kiếm thông tin nào đó trên Google. Mua sắm ở các trang thương mại trực tuyến và nhận thấy các trang này.
Xem thêm: Big Data công nghệ biến “sắt” thành mỏ “vàng”, Cơ hội và thách thức
1. Xu hướng nghề nghiệp trong tương lai
Hiện tại, chúng ta đang sống trong giai đoạn đầu của thời kỳ cách mạng công nghiệp lần thứ 4. Triết lý của cuộc cách mạng công nghiệp 4.0 là chúng ta phải sử dụng công nghệ thông tin để tăng được năng suất lao động, từ đó tiết kiệm được chi phí, mang lại lợi ích cho người tiêu dùng.
Xem thêm: CHUYÊN GIA PHÂN TÍCH DỮ LIỆU – SỰ THÀNH CÔNG TRONG TƯƠNG LAI
Nếu các bạn hoạt động, làm việc trong lĩnh vực thương mại điện tử (E-commerce) hay digital marketing chắc biết đến Data management platform (DMP) còn được gọi là nền tảng quản lý dữ liệu tập trung.
Xem thêm: TẦM QUAN TRỌNG CỦA QUẢN LÝ DỮ LIỆU (DATA MANAGEMENT) (P1)
Bối cảnh, nguyên nhân tại sao các công ty ngày nay cần định hướng dữ liệu (Data – driven)
Nếu các bạn có theo dõi những các bài viết trước đây của thì chúng tôi đã đề cập nhiều về tầm quan trọng của dữ liệu – được coi là nguồn sống của mọi tổ chức trong thời đại 4.0 – cũng như các xu hướng của Big Data, Data Analytics, và nhu cầu khai thác dữ liệu để đạt được giá trị, lợi ích trong kinh doanh ngày càng được quan tâm hơn.
Xem thêm: CÔNG TY ĐỊNH HƯỚNG DỮ LIỆU (DATA – DRIVEN ENTERPRISE) (PHẦN 1)
Dữ liệu (Data) được coi là biểu tượng hoặc dấu hiệu, đại diện cho các kích thích hoặc tín hiệu, sự kiện đã xảy ra được ghi nhận bởi tác nhân quan sát (sensor, người hay thiết bị thu thập data chuyên dụng)
Trở lại với chủ đề bài viết về thuật toán cây quyết định, ở bài viết trước đã giới thiệu đến các bạn tổng quan thế nào là Decision Tree, các công thức quan trọng để xác định cách phân nhánh tối ưu hay nói cách khác là đem lại kết quả phân loại (classification) chính xác dựa trên các thuộc tính dữ liệu và đặc biệt là thuật toán CART (classification and regression tree) sử dụng công thức “Goodness of Split”.
Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.2): CART (GINI INDEX)
Tầm quan trọng của Big Data (Dữ liệu lớn) và sự nhận thức về giá trị của nó giảm dần, nhiều công ty đầu tư vào lĩnh vực này nhưng không đem lại kỳ vọng, và kết quả tốt lợi. Nguyên nhân do nhu cầu và tính chất phức tạp của hệ thống công nghệ kỹ thuật phải xây dựng, bảo trì, chi phí lại cao, thiếu nguồn nhân lực có chuyên môn sâu, và kỹ năng về lĩnh vực Data Science hay Data Analytics,…
Ở các phần trước trong chủ đề về Statistics (thống kê) đã giới thiệu đến các bạn các khái niệm, lợi ích, ứng dụng của thống kê, đặc biệt Descriptive statistics (thống kê mô tả), một trong 2 dạng cơ bản của Statistics. Trở lại với bài viết lần này chúng tôi sẽ trình bày tóm tắt về dạng còn lại, chính là một số kiến thức của Inferential Statistics hay còn gọi là thống kê suy luận.
Xem thêm: TỔNG QUAN VỀ STATISTICS: INFERENTIAL STATISTICS (THỐNG KÊ SUY LUẬN)
Quay trở lại với chủ đề về dữ liệu khách hàng, ở bài viết phần 1 và phần 2, đã giới thiệu đến các bạn những khái niệm về phân tích dữ liệu khách hàng, loại dữ liệu khách hàng có thể thu thập, và lợi ích, cũng như mục đích của quá trình Customer data analytics. Trong phần 3 lần này, chúng tôi sẽ cung cấp những giải pháp hỗ trợ các công ty khai thác nguồn dữ liệu khách hàng của họ sao cho hiệu quả nhất.
Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.3) GIẢI PHÁP KHAI THÁC CUSTOMER DATA HIỆU QUẢ
Big data trong ngành du lịch đang bùng nổ trong những năm gần đây. Nhiều người cho rằng Big Data sẽ lấy đi sự cá nhân hóa của các doanh nghiệp du lịch, nhưng điều này không hề đúng bởi công nghệ du lịch đã phát triển và Big Data đang được sử dụng để đưa thêm nhiều sự liên hệ cá nhân vào trải nghiệm khách hàng. Vậy Big Data là gì và nó được sử dụng như thế nào trong ngành du lịch? Hãy cùng tìm hiểu trong bài viết dưới đây.
Xem thêm: Từ BIG DATA đến cá nhân hóa trong lĩnh vực du lịch
Bài chia sẻ của Ths.Bs Nguyễn Thành Danh (Danh Nguyen) - chuyên gia trong lĩnh vực quản lý y tế sau khi tham dự Hội thảo “Big Data trong cải tiến chất lượng y tế” được tổ chức tại Bệnh viện Việt Đức:
Xem thêm: Bùng nỗ digital healthcare, big data trong lĩnh vực y tế đang đến rất gần
Ứng dụng Big Data trong ngành truyền thông và giải trí là cả một nghệ thuật. Khoa học và nghệ thuật là hai lĩnh vực trái ngược. Nhưng Big Data và nghệ thuật lại bổ sung cho nhau khá tốt. Ngành truyền thông và giải trí đã chứng kiến một sự thay đổi lớn thông qua liên kết với phân tích Big Data.
Xem thêm: Ứng dụng Big Data trong ngành truyền thông và giải trí
Ngoài ra chúng tôi còn có sẵn data địa điểm rất hữu ích cho các dự án khởi nghiệp về du lịch, địa điểm, mạng xã hội du lịch, ...
Xem thêm: Dịch vụ và giải pháp Big Data cho lĩnh vực du lịch
Big Data được ứng dụng trong rất nhiều lĩnh vực khác nhau như đã giới thiệu ở bài viết “Big Data – Tên gọi gợi lên khái niệm”. Bài viết tiếp theo dưới đây sẽ nói chi tiết hơn về các ứng dụng của Big data trong từng trường hợp cụ thể, và trong từng lĩnh vực đặc thù. Qua đó chúng ta sẽ thấy được tầm quan trọng trong việc thu thập và phân tích dữ liệu Big data.
Tại Việt Nam, kho dữ liệu còn rất hạn chế, muốn nghiên cứu phải đòi hỏi nền tảng công nghệ rất lớn. Tuy nhiên, để phục vụ người dân tốt hơn thì việc xây dựng dữ liệu lớn (big data) là việc cần thiết, phải đẩy mạnh triển khai trong thời gian tới.
Nhiều doanh nghiệp Việt Nam chưa xây dựng big data trong hoạt động sản xuất, kinh doanh và quản trị doanh nghiệp
Hội thảo Quốc tế về Thống kê Du lịch do Liên Hợp Quốc (UN) tổ chức vào cuối tháng 6, 2017 tại Manilla, Phillippines đã nhấn mạnh tới cách các thành phố sử dụng công nghệ Dữ liệu lớn (Big Data) để quản lý du lịch tốt hơn.
Theo một báo cáo mới được công bố tại Diễn đàn Kinh tế Thế giới, những thay đổi về nhân khẩu học và tiến bộ kỹ thuật có thể dẫn đến việc 5 triệu việc làm sẽ biến mất vào năm 2020. Tuy nhiên, ngược lại có một số công việc lại được dự đoán sẽ có sự tăng trưởng đáng kể, trong đó có nghề phân tích dữ liệu.
Big data hay còn gọi là dữ liệu lớn, làm liên tưởng đến hình ảnh của hệ thống máy chủ khổng lồ. Nhưng Big data rộng và lớn hơn thế nhiều. Có 10 lĩnh vực chính trong đó dữ liệu hiện đang được sử dụng để tạo lợi thế tuyệt vời. Trong đó, dữ liệu có thể được đưa vào hầu hết mọi mục đích.
Big Data ngày càng được sử dụng để tối ưu hóa các quy trình kinh doanh. Các nhà bán lẻ có thể tối ưu hóa cổ phiếu của họ dựa trên dự đoán. Từ dữ liệu truyền thông xã hội, xu hướng tìm kiếm trên web và dự báo thời tiết.
Xem thêm: Giải Pháp Big Data Tối ưu hóa quy trình kinh doanh
Trở lại với chủ đề bài viết về Data mining, ở 2 phần trước đã giới thiệu dến các bạn khái niệm, tầm quan trọng, lợi ích, thách thức và đặc biệt là ứng dụng của Data mining trong nhiều lĩnh vực khác nhau. Phần cuối của chủ đề Data mining lần này, sẽ phân tích về các quy trình, kỹ thuật và thuật toán của Data mining, hay tìm hiểu làm cách Data mining khai thác giá trị, những thông tin hữu ích từ dữ liệu?
Xem thêm: TỔNG QUAN VỀ DATA MINING (P3): QUÁ TRÌNH VÀ PHƯƠNG PHÁP
Hiện nay dữ liệu lớn (big data) và khoa học dữ liệu là một lĩnh vực rất sôi nỗi và phát triễn nhanh trong thời gian gần đây. Như đánh giá của Trường Đại Học Harvard, Hoa Kỳ thì nhà khoa học dữ liệu (data scientist) sẽ là công việc hấp dẫn nhất thế kỹ 21.
Mỗi năm thiên tai như bão, lũ lụt, động đất gây ra thiệt hại rất lớn và nhiều sinh mạng. Các nhà khoa học không thể dự đoán khả năng xảy ra thảm họa và đề xuất đủ biện pháp phòng ngừa cho chính phủ nếu không có sự giúp đỡ của Big Data.
Ở phần 1 “Sự bùng nổ của social media và xu hướng marketing mới”, chúng ta đã tìm hiểu về social media và xu hướng marketing tập trung vào social media trong thời đại công nghệ phát triển. Tiếp theo của chủ đề bài viết, chúng ta sẽ tìm hiểu về tác động của Big data và lợi ích của nó đến social media marketing.
Xem thêm: TÁC ĐỘNG BIG DATA ĐẾN XU HƯỚNG SOCIAL MEDIA MARKETING
Ở 2 bài viết trước đã giới thiệu đến các bạn thuật toán Classification đầu tiên là KNN (K – nearest neighbor) và một số phương pháp đánh giá mô hình phân loại như Hold out, Cross validation, hay Confusion matrix, Lift, Gain chart, ROC/ AUC. Trở lại với chủ đề về những thuật toán phân loại trong Data mining, lần này chúng tôi và các bạn sẽ tìm hiểu về Decision Tree, thuật toán có thể nói là “nổi tiếng”, “phổ biến” mà bất kỳ ai hoạt động và làm việc trong lĩnh vực khoa học dữ liệu, hoặc phân tích dữ liệu đều phải biết đến.
Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.1) : CLASSIFICATION & REGRESSION TREE (CART)
Hàn Quốc tự hào là nước có ngân hàng dữ liệu quốc gia về sức khoẻ của toàn bộ người dân. Hiện nay, Hàn Quốc đã bắt đầu nghiên cứu ứng dụng “Y học chính xác” hay “Y học cá thể” từ kho dữ liệu lớn về sức khoẻ của quốc gia. Tại quốc gia này, dữ liệu sức khoẻ của người dân được chia làm 6 nhóm dữ liệu.
Dữ liệu gen và SDOH là đầu vào của tình trạng sức khỏe, dữ liệu lâm sàng và PGHD là đầu ra của tình trạng sức khỏe
Xem thêm: Tìm hiểu các loại dữ liệu sức khoẻ của “Big data” tại Hàn Quốc
Mời quý vị tham khảo hồ sơ năng lực của DVMS tại đây >>
Head Office: 95/2/26 Bình Lợi, Phường 13, Q. Bình Thạnh, TP.HCM, Việt Nam.
Tel: 02836028937
Email: sale@dvms.vn
BạnCầnGìCứHỏiDVMS: Chuyển đổi số giao thông, vận tải, giao nhận thông minh ; Giải pháp Blockchain ; Tư vấn, xây dựng, chuyển giao mạng xã hội ; Dịch vụ dữ liệu, Big data ; Uber Giúp việc, uber dịch vụ tại nhà ; Chuyển đổi số cho bệnh viện, y tế ; Chuyển đổi số Bác sĩ gia đình, y tế tại nhà ; Chuyển đổi số cho công ty tín dụng, ngân hàng, Fintech ; Chuyển đổi số cho công ty bảo hiểm ; Chuyển đổi số bán hàng, quản lý hệ thống phân phối ; Chuyển đổi số lĩnh vực du lịch; Chuyển đổi số lĩnh xăng dầu, gas; Giải pháp OTT; Chuyển đổi số nhà thuốc và công ty dược; Chuyển đổi số doanh nghiệp taxi; Chuyển đổi số doanh nghiệp vận tải; Chuyển đổi số dịch vụ tại nhà; Chuyển đổi số nông nghiệp; Giải pháp QRCODE ; Đào tạo chuyển đổi số, xây dựng đội ngũ CNTT cho doanh nghiệp và start-up; Giải pháp chăm sóc sức khỏe tại nhà ; ứng dụng định vị vệ tinh vào cuộc sống;Giải pháp truyền hình; thực tế ảo; mobile game; và giải pháp cho nhiều lĩnh vực khác