Hầu hết người dùng trực tuyến đều đã từng gặp rắc rối với PayPal hoặc hệ thống thanh toán số khác. Hãy tưởng tượng rằng bạn đang cố gắng rút tiền mà ai đó đã gửi cho bạn, và phát hiện ra bạn đã bị chặn khỏi dịch vụ đó mà không hề biết lý do tại sao. Hoặc có thể bạn phát hiện ra rằng phí có thể khá shock khi bạn bắt đầu sử dụng các dịch vụ mở rộng. Và, điều nhức nhối nhất: PayPal không chấp nhận tiền điện tử.

Xem thêm: Blockchain thế hệ mới thay thế PayPal
Xu hướng đi lễ chùa và làm lễ giải hạn cầu an ngày một rầm rộ trong những năm gần đây. Đi kèm, là những khoản tiền đóng góp theo quy định hoặc tùy tâm công đức rất lớn. Nhưng vấn đề khó nhất, đó là tính minh bạch của những khoản tiền này và ai là người quản lý? Thu được bao nhiêu? Sử dụng như thế nào?...?

Xem thêm: Blockchain và câu chuyện minh bạch hóa tiền công đức
Theo một báo cáo mới được công bố tại Diễn đàn Kinh tế Thế giới, những thay đổi về nhân khẩu học và tiến bộ kỹ thuật có thể dẫn đến việc 5 triệu việc làm sẽ biến mất vào năm 2020. Tuy nhiên, ngược lại có một số công việc lại được dự đoán sẽ có sự tăng trưởng đáng kể, trong đó có nghề phân tích dữ liệu.

Xem thêm: Chọn nghề phân tích dữ liệu?
Trở lại với chủ đề về các xu hướng Big Data sẽ đi đầu trong năm 2019, ở phần 1, Big Data Uni đã đề cập về sự phát triển và thay đổi của Internet of Things (IOT), trí tuệ nhân tạo (Artificial Intelligence – AI), Machine Learning (ML) tác động như thế nào đến lĩnh vực Big Data, và một số dự báo về thị trường Big Data. Phần 2 bài viết, chúng tôi sẽ đề cập chi tiết về các xu hướng của những công cụ, cách thức hỗ trợ cho việc khai thác, tiếp cận Big Data, cùng với các vấn đề, thách thức mới trong lĩnh vực Big Data.

Xem thêm: TOP CÁC XU HƯỚNG BIG DATA SẼ ĐI ĐẦU TRONG NĂM 2019 (PHẦN 2)
1. Big data là gì? Nó khác gì với việc lưu giữ và phân tích data truyền thống ?

Xem thêm: Hiểu, Học và ứng dụng Big Data như thế nào?
Một trong những xu hướng phát triển cùng với thời đại đó chính là việc áp dụng phân tích dữ liệu Big data trong doanh nghiệp. Dưới đây là một số ứng dụng của Big data được nhiều doanh nghiệp lớn áp dụng. Từ đó rút ra bài học kinh nghiệm cho các doanh nghiệp Việt Nam, khi có thể còn đang chật vật với việc phân tích dữ liệu.

Xem thêm: Ứng dụng của Big Data và bài học cho những doanh nghiệp Việt Nam hiện nay
Phân tích dữ liệu là một công việc rất quan trọng giúp chúng ta có thể lập báo cáo tốt hơn, tránh được những sai sót, đảm bảo được tính chính xác của báo cáo. Vậy phân tích dữ liệu là phải làm những công việc gì? Sau đây chúng ta sẽ tìm hiểu về kỹ năng phân tích dữ liệu trước khi lập báo cáo trên Excel thông qua 1 bài tập sau:
Giả sử rằng bạn làm ở vị trí trưởng bộ phận bán hàng. Cuối tháng bạn nhận được 1 bảng dữ liệu về bán hàng trong tháng của cửa hàng mình như sau:

Tầm quan trọng của Big Data (Dữ liệu lớn) và sự nhận thức về giá trị của nó giảm dần, nhiều công ty đầu tư vào lĩnh vực này nhưng không đem lại kỳ vọng, và kết quả tốt lợi. Nguyên nhân do nhu cầu và tính chất phức tạp của hệ thống công nghệ kỹ thuật phải xây dựng, bảo trì, chi phí lại cao, thiếu nguồn nhân lực có chuyên môn sâu, và kỹ năng về lĩnh vực Data Science hay Data Analytics,…

Xem thêm: TỔNG QUAN VỀ BIG DATA TRÊN TOÀN CẦU
Từ khi có ứng dụng data science, ngành y tế và chăm sóc sức khỏe cũng có những bước nhảy vọt quan trọng. 5 nhóm lĩnh vực data science đã áp dụng thành công những ứng dụng của data science có thể kể đến như Phân tích hình ảnh y khoa, gien và bộ gien, Điều chế thuốc, phân tích và chẩn đoán, ứng dụng phần mềm sức khỏe hay trợ lý sức khỏe tâm lý.

Xem thêm: Ứng dụng Data Science vào lĩnh vực Y tế mang tính đột phá
Data visualization tạm được dịch là trực quan hóa dữ liệu, đây là phương pháp không chỉ là bước quan trọng của bất kỳ quy trình phân tích, hay khai phá dữ liệu mà nó còn là công cụ được sử dụng phổ biến và rộng rãi ở mọi tổ chức thuộc mọi lĩnh vực, hay bởi mỗi một ai trong chúng ta, với mục đích đơn giản là truyền đạt, trình bày một cách hiệu quả, đơn giản, thu hút những thông tin, dữ liệu đến người đọc, người xem.

Xem thêm: TỔNG QUAN VỀ DATA VISUALIZATION (TRỰC QUAN HÓA DỮ LIỆU)
Đa số các bạn nhảy vào phân tích dữ liệu ngay, trước khi bạn lên kế hoạch và mục tiêu của dự án phân tích dữ liệu. Và cũng tương tự như vậy, bạn có thể nhảy vào làm slide cho một buổi thuyết trình trong môi trường kinh doanh trước khi bạn lên kế hoạch cho thuyết trình đó. Và tất nhiên bạn sẽ kết quả là tốn rất nhiều thời gian cho slide mà không đạt được kết quả tốt nhất.

Xem thêm: Phương pháp thuyết trình đạt hiệu quả trong môi trường kinh doanh!
Quay trở lại với chủ đề về dữ liệu khách hàng, ở bài viết phần 1 và phần 2, đã giới thiệu đến các bạn những khái niệm về phân tích dữ liệu khách hàng, loại dữ liệu khách hàng có thể thu thập, và lợi ích, cũng như mục đích của quá trình Customer data analytics. Trong phần 3 lần này, chúng tôi sẽ cung cấp những giải pháp hỗ trợ các công ty khai thác nguồn dữ liệu khách hàng của họ sao cho hiệu quả nhất.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.3) GIẢI PHÁP KHAI THÁC CUSTOMER DATA HIỆU QUẢ
Ở các phần trước trong chủ đề về Statistics (thống kê) đã giới thiệu đến các bạn các khái niệm, lợi ích, ứng dụng của thống kê, đặc biệt Descriptive statistics (thống kê mô tả), một trong 2 dạng cơ bản của Statistics. Trở lại với bài viết lần này chúng tôi sẽ trình bày tóm tắt về dạng còn lại, chính là một số kiến thức của Inferential Statistics hay còn gọi là thống kê suy luận.

Xem thêm: TỔNG QUAN VỀ STATISTICS: INFERENTIAL STATISTICS (THỐNG KÊ SUY LUẬN)
Dữ liệu khách hàng hay Customer data được coi là tài sản, nguồn thông tin vô giá đối với mọi công ty thuộc nhiều lĩnh vực kinh doanh khác nhau. Việc triển khai các quy trình khai thác, dự án nghiên cứu, phân tích Customer data với mục đích tìm hiểu, nắm bắt mong muốn, nhu cầu thầm kín của khách hàng, và chuyển nó thành những giá trị cụ thể thông qua từng chiến lược, kế hoạch hoạt động chính là chìa khóa cạnh tranh của mỗi tổ chức ngày nay.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.1) – DỮ LIỆU KHÁCH HÀNG LÀ GÌ?
Dữ liệu lớn có ở rất nhiều tổ chức, nhiều hoạt động xã hội, kinh doanh, khoa học và tiềm ẩn nhiều giá trị to lớn. Việc đó đồng nghĩa với các nhà khoa học phải đau đầu khi đối phó với việc lưu trữ, xử lý khối lượng số liệu khổng lồ và đa dạng về chủng loại dữ liệu.

Xem thêm: Big data với những vấn đề, giải pháp & thách thức
Bạn có biết là những vị trí liên quan tới lĩnh vực khoa học dữ liệu (data science) và phân tích dữ liệu (data analysis) là khó tuyển nhất với một công ty không? Sự bùng nổ nhu cầu tìm kiếm các chuyên gia trong những lĩnh vực này mở ra hàng loạt nhu cầu và đồng thời, đẩy thị trường tuyển dụng vào tình trạng cung không đủ đáp ứng cầu.

Xem thêm: Data Analysis là gì? Cần học những gì?
Big Data mang lại cơ hội cho lĩnh vực bán lẻ bằng cách phân tích thị trường cạnh tranh và sự quan tâm của khách hàng. Nó giúp xác định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng bằng cách thu thập dữ liệu đa dạng.

Xem thêm: Giải pháp Big data cho lĩnh vực Bán Lẻ
Thị trường E-commerce cùng với sự ra đời của những thành quả Cách mạng công nghiệp 4.0 như Artificial Intelligent (trí tuệ nhân tạo AI), Machine Learning (học máy) và đặc biệt là Big Data đã thay đổi một cách chóng mặt từ cách thức tiếp cận khách hàng cho đến cách thức quản lý, phân phối sản phẩm hàng hóa thông qua các webstie, app thông minh,..

Xem thêm: ỨNG DỤNG BIG DATA TRONG LĨNH VỰC E-COMMERCE (PHẦN 1)
Trở lại với chủ đề về thống kê, ở phần trước chúng tôi đã giới thiệu đến các bạn các khái niệm về thống kê cũng như lợi ích và ứng dụng của nó, tiếp theo ở phần này, chúng tôi sẽ đề cập đến một mảng kiến thức quan trọng khác đó chính Descriptive statistics (thống kê mô tả)

Xem thêm: TỔNG QUAN VỀ STATISTICS: DESCRIPTIVE STATISTICS (THỐNG KÊ MÔ TẢ)
Quyển sách mới ra “hiểu số để tăng số – Sexy little number” của Dimitrix Maex & Paul B.Brown đưa ra một góc nhìn tổng hợp trong việc sử dụng số liệu để thực hiện tiếp thị marketing trong thời đại công nghiệp số hoá, dữ liệu lớn. Trong bài này chúng tôi sẽ tóm tắt 1 số ý chính từ quyển sách cho bạn không có thời gian đọc hết quyển sách này.

Xem thêm: Sử dụng số liệu trong kinh doanh thời đại số
Ứng dụng Big Data trong ngành truyền thông và giải trí là cả một nghệ thuật. Khoa học và nghệ thuật là hai lĩnh vực trái ngược. Nhưng Big Data và nghệ thuật lại bổ sung cho nhau khá tốt. Ngành truyền thông và giải trí đã chứng kiến một sự thay đổi lớn thông qua liên kết với phân tích Big Data.

Xem thêm: Ứng dụng Big Data trong ngành truyền thông và giải trí
Thương mại điện tử không chỉ tận hưởng những lợi ích của việc điều hành trực tuyến mà còn phải đối mặt với nhiều thách thức để đạt được các mục tiêu kinh doanh. Lý do là bởi các doanh nghiệp dù là nhỏ hay lớn, khi đã tham gia vào thị trường này đều cần đầu tư mạnh để cải tiến công nghệ.

Xem thêm: Giải pháp Big data cho Thương Mại Điện Tử
Để thành công và phát triển, một công ty cần phải có khả năng đạt được, giữ chân, thỏa mãn và thu hút càng nhiều khách hàng càng tốt. Hiểu rõ hơn về khách hàng thông qua phân tích dữ liệu khách hàng vừa là công việc, nhiệm vụ rất quan trọng vừa là cơ sở để đánh giá công ty hoạt động hiệu quả như thế nào.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.2) LỢI ÍCH CỦA DỮ LIỆU KHÁCH HÀNG
Khoa học phân tích dữ liệu là một nhánh rẽ quan trọng trong lĩnh vực công nghệ thông tin. Nó sớm bộc lộ những tiềm lực quan trọng thúc đẩy sự phát triển của thế giới. Với sự phát triển nhanh chóng và lan rộng của mình, ngành Khoa học Dữ liệu đặc biệt thu hút sự quan tâm của các chuyên gia Việt Nam và cả trên khắp thế giới.

Xem thêm: Khoa học phân tích dữ liệu – Góc nhìn từ Việt Nam và Thế Giới
Big data trong ngành du lịch đang bùng nổ trong những năm gần đây. Nhiều người cho rằng Big Data sẽ lấy đi sự cá nhân hóa của các doanh nghiệp du lịch, nhưng điều này không hề đúng bởi công nghệ du lịch đã phát triển và Big Data đang được sử dụng để đưa thêm nhiều sự liên hệ cá nhân vào trải nghiệm khách hàng. Vậy Big Data là gì và nó được sử dụng như thế nào trong ngành du lịch? Hãy cùng tìm hiểu trong bài viết dưới đây.

Xem thêm: Từ BIG DATA đến cá nhân hóa trong lĩnh vực du lịch
Hàn Quốc tự hào là nước có ngân hàng dữ liệu quốc gia về sức khoẻ của toàn bộ người dân. Hiện nay, Hàn Quốc đã bắt đầu nghiên cứu ứng dụng “Y học chính xác” hay “Y học cá thể” từ kho dữ liệu lớn về sức khoẻ của quốc gia. Tại quốc gia này, dữ liệu sức khoẻ của người dân được chia làm 6 nhóm dữ liệu.

Dữ liệu gen và SDOH là đầu vào của tình trạng sức khỏe, dữ liệu lâm sàng và PGHD là đầu ra của tình trạng sức khỏe
Xem thêm: Tìm hiểu các loại dữ liệu sức khoẻ của “Big data” tại Hàn Quốc
Chủ đề về Big Data tác động đến social media marketing (tiếp thị qua mạng xã hội), mà cung cấp đến các bạn sẽ được chia thành 2 phần
- Phần 1: Sự “bùng nổ” của social media và xu hướng marketing mới
- Phần 2: Tác động của Big data đến xu hướng social media marketing

Xem thêm: SỰ “BÙNG NỔ” CỦA SOCIAL MEDIA VÀ XU HƯỚNG MARKETING MỚI
với khát vọng là công ty đi đầu trong lĩnh vực khai phá dữ liệu Big Data, và tư vấn chiến lược trong tương lai, sẵn sàng hỗ trợ, đồng hành cùng bạn – dù bạn là ai – trên con đường khai phá Big Data. Nhưng trước hết công ty giới thiệu các bước khai thác Big Data. Theo SAS, các bước khai phá Big Data bao gồm:

Xem thêm: THÁCH THỨC TRONG QUÁ TRÌNH KHAI THÁC DỮ LIỆU BIG DATA
Trở lại với chủ đề về các thuật toán cây quyết định Decision trees, như vậy qua các bài viết trước chúng ta đã tìm hiểu về tổng quan thuật toán cây quyết định là gì, làm quen với các dạng thuật toán CART (phân 2 nhánh) sử dụng công thức Goodness of Split, Gini Index và C4.5 (phân nhiều hơn 2 nhánh) sử dụng công thức Entropy kết hợp với Information gain.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.4): ƯU & KHUYẾT ĐIỂM, STOPPING & PRUNING METHOD
Quay trở lại với chủ đề về Decision trees, thì ở 2 bài viết trước đã giới thiệu đến các bạn khái quát thế nào là thuật toán cây quyết định, bao gồm các thành phần, và một số công thức tính toán để lựa chọn các biến phân nhánh hay cách phân nhánh tối ưu, mục đích dự báo, phân loại, phân nhóm các đối tượng dữ liệu vào các nhóm, các lớp của biến mục tiêu sao cho chính xác nhất.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.3): C4.5 (ENTROPY)
Phân tích dữ liệu dự đoán đang nhanh chóng trở thành động lực thúc đẩy tiếp thị hiện đại. Phân tích dữ liệu dự đoán là quá trình sử dụng dữ liệu lịch sử và hiện tại kết hợp với học máy để dự báo một số kết quả nhất định.

Xem thêm: 6 cách phân tích dữ liệu dự đoán đang định hình lại marketing
Không có gì phải nghi ngờ, khi tất cả các doanh nghiệp hiện tại đều bị thôi thúc bởi lợi ích của việc khai thác dữ liệu (data) – thu thập, quản lý, xử lý, phân tích và diễn giải. Điều đó đòi hỏi mỗi tổ chức cần có một cơ sở dữ liệu (database) mới, tiên tiến để đáp ứng với môi trường kinh doanh hiện đại do các database cũ không thể bắt kịp tốc độ thay đổi về hình thức và khối lượng dữ liệu.

Xem thêm: QUẢN LÝ DỮ LIỆU LÀ CƠ HỘI TẠO GIÁ TRỊ KINH DOANH
Ở thời điểm nay, không phải tài sản vật chất, thiết bị máy móc hay cơ sở hạ tầng sản phẩm là tài sản lớn nhất của một doanh nghiệp, mà chính là khách hàng. Nếu bạn không thể làm hài lòng khách hàng và hiểu nhu cầu của họ, thì bạn sẽ không bao giờ trở thành chủ sở hữu của một doanh nghiệp thành công.

Xem thêm: Giải pháp Big data cho lĩnh vực Dịch Vụ Khách Hàng
Hàng ngày, chúng ta thường xuyên kết nối thông qua điện thoại, máy tính bảng, bảng điều khiển trò chơi và hầu hết các ứng dụng, các kênh kết nối đều được thực hiện qua các thiết bị này.Khi di chuyển giữa các thiết bị và kênh, họ đang tạo ra nhiều điểm tiếp xúc, kết nối giữa các thiết bị khác nhau mà không hề hay biết.

Xem thêm: BIG DATA Là Chìa Khóa Thành Công Của Marketing Thời Đại Số
Chắc bạn đã một lần từng nghe, hoặc biết đến Chatbot khi đã vô tình bắt gặp nó được thể hiện ở các trang mạng xã hội (social media platform) hay trên các ứng dụng mua sắm trực tuyến (online shopping application). Chatbot hiện đang là công cụ hỗ trợ đắc lực dành cho các công ty, tổ chức trong việc phát triển, duy trì và cải thiện mối quan hệ với khách hàng (customer relationship management).

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 1) CHATBOT LÀ GÌ?
Trở lại với chủ đề về Data mining, ở phần 1 đã giới thiệu đến các bạn về khái niệm, tầm quan trọng, lợi ích chính và thách thức của Data mining, tiếp tục với phần 2, sẽ đi vào phân tích các ứng dụng của Data mining trong các lĩnh vực một cách chi tiết hơn. Nhưng trước tiên chúng ta cùng điểm qua các loại thông tin và loại dữ liệu được thu thập và phân tích bằng các công cụ Data mining.

Xem thêm: TỔNG QUAN VỀ DATA MINING (P2): ỨNG DỤNG TRONG CÁC LĨNH VỰC
Nếu các bạn đã theo dõi các bài viết của Big Data Uni thì chắc cũng đã nắm được tổng quan về Big Data bao gồm khái niệm, lợi ích và ứng dụng của nó trong nhiều lĩnh vực khác nhau. Trong chủ đề bài viết lần này và sắp tới, chúng tôi sẽ không đề cập về những giá trị mà Big Data đem lại mà đi vào trọng tâm một trong những công cụ, quá trình quan trọng nhất đối với mỗi dự án Big Data đó chính là Data mining (hay còn gọi là khai phá dữ liệu).

Xem thêm: TỔNG QUAN VỀ DATA MINING (P1): KHAI PHÁ DỮ LIỆU LÀ GÌ?
Tất cả chúng ta đang đều sống và làm việc trong thời đại công nghệ hiện đại nó đang làm thay đổi toàn bộ cục diện của tất cả hầu hết các lĩnh vực kinh tế, xã hội, y tế, quốc phòng,..

Xem thêm: BIG DATA – THÀNH QUẢ CỦA CÁCH MẠNG CÔNG NGHỆ HIỆN ĐẠI
Đây là một trong những lĩnh vực sử dụng Big data công khai và lớn nhất hiện nay. Big data được sử dụng để hiểu rõ hơn về khách hàng cũng như hành vi và sở thích của họ. Các công ty rất muốn mở rộng bộ dữ liệu truyền thông của họ, dữ liệu truyền thông xã hội, nhật ký trình duyệt cũng như phân tích văn bản, dữ liệu cảm biến. Để có được bức tranh đầy đủ hơn về khách hàng của họ. Mục tiêu lớn hơn, trong nhiều trường hợp, là tạo ra các mô hình dự đoán.

Xem thêm: Giải pháp Big data giúp hiểu Khách Hàng Mục Tiêu
Ở bài viết trước, đã giới thiệu đến các bạn khái niệm về Data management – quản lý dữ liệu – lịch sử ra đời, cũng như các thành phần, quy trình, chức năng có trong Data management. Trở lại với phần 2 “Tầm quan trọng của quản lý dữ liệu” , sẽ đi vào phân tích chi tiết các lợi ích chính, các thách thức mỗi tổ chức phải đối mặt khi triển khai, và liệt kê một số giải pháp thực tiễn sẽ hỗ trợ hiệu quả.

Xem thêm: TẦM QUAN TRỌNG CỦA QUẢN LÝ DỮ LIỆU (DATA MANAGEMENT) (P2)
Murray Webb, 33 tuổi, tốt nghiệp thạc sĩ về thống kê ứng dụng (applied statistics) tại Trường Đại học Kennesaw (Atlanta, Mỹ), hiện kiếm được 160.000 đô la một năm với công việc chủ yếu là theo dõi phần thông tin về dữ liệu chăm sóc sức khỏe khách hàng cho các bệnh viện. Webb cho biết hằng tuần đều có người đại diện của các công ty cũng như các công ty chuyên cung cấp nguồn nhân lực tìm đến anh và đưa ra các lời mời làm việc như một nhà khoa học dữ liệu (data scientist).

Xem thêm: Khoa học dữ liệu – nghề đang hái ra tiền ở Mỹ
TTCT - College Board, tổ chức phi lợi nhuận đang phụ trách kỳ thi SAT, đã bán mỗi cái tên thí sinh kèm theo các thông tin liên quan với giá 47 cent (khoảng 11.000 đồng), gây ra những tranh cãi dữ dội về tuyển sinh đại học ở Mỹ.
Tại Việt Nam, kho dữ liệu còn rất hạn chế, muốn nghiên cứu phải đòi hỏi nền tảng công nghệ rất lớn. Tuy nhiên, để phục vụ người dân tốt hơn thì việc xây dựng dữ liệu lớn (big data) là việc cần thiết, phải đẩy mạnh triển khai trong thời gian tới.

Nhiều doanh nghiệp Việt Nam chưa xây dựng big data trong hoạt động sản xuất, kinh doanh và quản trị doanh nghiệp
Xem thêm: Việt Nam còn thiếu big data?
Big Data được ứng dụng trong rất nhiều lĩnh vực khác nhau như đã giới thiệu ở bài viết “Big Data – Tên gọi gợi lên khái niệm”. Bài viết tiếp theo dưới đây sẽ nói chi tiết hơn về các ứng dụng của Big data trong từng trường hợp cụ thể, và trong từng lĩnh vực đặc thù. Qua đó chúng ta sẽ thấy được tầm quan trọng trong việc thu thập và phân tích dữ liệu Big data.

Xem thêm: ỨNG DỤNG CỦA BIG DATA TRONG MỌI LĨNH VỰC