DVMS Co., Ltd

Ứng dụng Bigdata

Bigdata Solutions | Tư vấn, xây dựng, chuyển giao Bigdata , xây dựng phần mềm Bigdata, xây dựng app Bigdata, xây dựng website Bigdata, giải pháp và dịch vụ liên quan tới Bigdata
  1. Một câu nói nổi tiếng của William Glasser, chuyên gia tâm thân học Mỹ:

    Chúng ta học….

    10% của những gì ta đọc được

    20% của những gì ta nghe thấy

    30% của những gì ta nhìn thấy

    50% của những gì ta nghe và nhìn thấy

    70% của những gì ta thảo luận

    80% của những gì ta trải nghiệm

    95% của những điều ta dạy người khác

    Phần mềm hiện thị dữ liệu, phân tích dữ liệu

  2. Ở phần 1 bài viết cùng chủ đề, đã giới thiệu các khái niệm về Data quality, Data quality management; lợi ích; tầm quan trọng; và các tiêu chuẩn, tiêu chí đánh giá chất lượng dữ liệu. Mặc dù nhiều công ty, tổ chức hiện nay đã nhận thức được sự cần thiết của các nhiệm vụ trong Data quality, nhưng họ vẫn phải đối mặt với nhiều thách thức, khó khăn khác nhau dẫn đến việc thiết lập, và triển khai các giải pháp thích hợp càng được quan tâm hơn bao giờ hết.

    TỔNG QUAN VỀ DATA QUALITY – CHẤT LƯỢNG DỮ LIỆU (P2)

  3. Phân tích dữ liệu là một công việc rất quan trọng giúp chúng ta có thể lập báo cáo tốt hơn, tránh được những sai sót, đảm bảo được tính chính xác của báo cáo. Vậy phân tích dữ liệu là phải làm những công việc gì? Sau đây chúng ta sẽ tìm hiểu về kỹ năng phân tích dữ liệu trước khi lập báo cáo trên Excel thông qua 1 bài tập sau:

    Giả sử rằng bạn làm ở vị trí trưởng bộ phận bán hàng. Cuối tháng bạn nhận được 1 bảng dữ liệu về bán hàng trong tháng của cửa hàng mình như sau:

    Tìm hiểu kỹ năng phân tích dữ liệu trước khi lập báo cáo trên Excel

  4. Thị trường E-commerce cùng với sự ra đời của những thành quả Cách mạng công nghiệp 4.0 như Artificial Intelligent (trí tuệ nhân tạo AI), Machine Learning (học máy) và đặc biệt là Big Data đã thay đổi một cách chóng mặt từ cách thức tiếp cận khách hàng cho đến cách thức quản lý, phân phối sản phẩm hàng hóa thông qua các webstie, app thông minh,..

    ỨNG DỤNG BIG DATA TRONG LĨNH VỰC E-COMMERCE (PHẦN 1)

  5. Phân tích dữ liệu dự đoán đang nhanh chóng trở thành động lực thúc đẩy tiếp thị hiện đại. Phân tích dữ liệu dự đoán là quá trình sử dụng dữ liệu lịch sử và hiện tại kết hợp với học máy để dự báo một số kết quả nhất định.

    6 cách phân tích dữ liệu dự đoán đang định hình lại marketing

  6. Có nhiều phương pháp khác nhau để thu thập dữ liệu. Người ta có thể chia thành hai loại.

    Đó là phương pháp bàn giấy phương pháp hiện trường.

    Các phương pháp thu thập dữ liệu

  7. Business Intelligenc (BI) hay Data Analytics – phân tích dữ liệu từ lâu đã trở thành các công cụ hữu ích hỗ trợ các tổ chức, công ty trong quá trình hoạt động và phát triển. Ở bài viết lần này, sẽ giới thiệu đến các bạn các lợi ích của phân tích dữ liệu trong kinh doanh, nhưng trước tiên ta cùng phân biệt rõ 2 khái niệm được nêu ở trên mà nhiều người thường nhầm lẫn.

    LỢI ÍCH PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH

  8. Nếu các bạn có theo dõi những bài viết của chúng tôi về Data management (quản lý dữ liệu) và Data quality (chất lượng dữ liệu), thì chắc cũng biết tầm quan trọng của quá trình Data security; sự ra đời của những bộ luật, điều luật về bảo mật thông tin, dữ liệu như GDPR tại châu Âu, luật An ninh Mạng ở nước ta; đặc biệt là xu hướng khách hàng đang ngày càng quan tâm hơn về tính minh bạch trong việc sử dụng, và khả năng bảo vệ nguồn dữ liệu, thông tin cá nhân của họ tại các công ty.

    THỰC TRẠNG DATA SECURITY TRÊN TOÀN CẦU

  9. Trở lại với chủ đề bài viết về Data mining, ở 2 phần trước đã giới thiệu dến các bạn khái niệm, tầm quan trọng, lợi ích, thách thức và đặc biệt là ứng dụng của Data mining trong nhiều lĩnh vực khác nhau. Phần cuối của chủ đề Data mining lần này, sẽ phân tích về các quy trình, kỹ thuật và thuật toán của Data mining, hay tìm hiểu làm cách Data mining khai thác giá trị, những thông tin hữu ích từ dữ liệu?

    TỔNG QUAN VỀ DATA MINING (P3): QUÁ TRÌNH VÀ PHƯƠNG PHÁP

  10. 1. Xu hướng nghề nghiệp trong tương lai

    Hiện tại, chúng ta đang sống trong giai đoạn đầu của thời kỳ cách mạng công nghiệp lần thứ 4. Triết lý của cuộc cách mạng công nghiệp 4.0 là chúng ta phải sử dụng công nghệ thông tin để tăng được năng suất lao động, từ đó tiết kiệm được chi phí, mang lại lợi ích cho người tiêu dùng.

    CHUYÊN GIA PHÂN TÍCH DỮ LIỆU – SỰ THÀNH CÔNG TRONG TƯƠNG LAI

  11. Ở 2 bài viết trước đã giới thiệu đến các bạn thuật toán Classification đầu tiên là KNN (K – nearest neighbor) và một số phương pháp đánh giá mô hình phân loại như Hold out, Cross validation, hay Confusion matrix, Lift, Gain chart, ROC/ AUC. Trở lại với chủ đề về những thuật toán phân loại trong Data mining, lần này chúng tôi và các bạn sẽ tìm hiểu về Decision Tree, thuật toán có thể nói là “nổi tiếng”, “phổ biến” mà bất kỳ ai hoạt động và làm việc trong lĩnh vực khoa học dữ liệu, hoặc phân tích dữ liệu đều phải biết đến.

    THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.1) : CLASSIFICATION & REGRESSION TREE (CART)

  12. Khái niệm dữ liệu thứ cấp

    Dữ liệu thứ cấp là dữ liệu đã có sẵn, không phải do mình thu thập, đã công bố nên dễ thu thập, ít tốn thời gian, tiền bạc trong quá trình thu thập nhưng là loại tài liệu quan trọng trong việc nghiên cứu tiếp thị cũng như các ngành khoa học xã hội khác.

    Dữ liệu thứ cấp là gì?

  13. Murray Webb, 33 tuổi, tốt nghiệp thạc sĩ về thống kê ứng dụng (applied statistics) tại Trường Đại học Kennesaw (Atlanta, Mỹ), hiện kiếm được 160.000 đô la một năm với công việc chủ yếu là theo dõi phần thông tin về dữ liệu chăm sóc sức khỏe khách hàng cho các bệnh viện. Webb cho biết hằng tuần đều có người đại diện của các công ty cũng như các công ty chuyên cung cấp nguồn nhân lực tìm đến anh và đưa ra các lời mời làm việc như một nhà khoa học dữ liệu (data scientist).

    Khoa học dữ liệu – nghề đang hái ra tiền ở Mỹ

  14. Dữ liệu sơ cấp là những dữ liệu chưa có sẵn, được thu thập lần đầu, do chính người nghiên cứu thu thập. Trong thực tế, khi dữ liệu thứ cấp không đáp ứng được yêu cầu nghiên cứu, hoặc không tìm được dữ liệu thứ cấp phù hợp thì các nhà nghiên cứu sẽ phải tiến hành thu thập dữ liệu sơ cấp.

    Dữ liệu sơ cấp là gì?

  15. Chuyên thu thập thông tin về địa chất trên toàn lãnh thổ Việt Nam và các nước lân cận, với mục đích chia sẻ các thông tin về địa tầng khu vực, tính chất cơ lý các lớp đất, mặt cắt địa chất công trình. Cung cấp các tài liệu địa chất và báo cáo khảo sát địa chất, số liệu địa chất tham khảo... dành cho nghành xây dựng, các giảng viên, sinh viên cần tài liệu để phục vụ cho việc nghiên cứu và học tập trong lĩnh vực địa chất công trình.

  16. Danh sách và nội dung của hàng ngàn truyện tranh đã phân loại theo từng chapter, thể loại truyện... của tất cả các đầu truyện tranh đang thịnh hành hiện nay.

    Với data này bạn có thể xây dựng ngay website đọc truyện tranh hoặc ứng dụng đọc truyện tranh mà không cần nhập liệu từ đầu. Quý vị nào có nhu cầu thì liên hệ theo thông tin ở phần liên hệ

  17. Hội thảo Quốc tế về Thống kê Du lịch do Liên Hợp Quốc (UN) tổ chức vào cuối tháng 6, 2017 tại Manilla, Phillippines đã nhấn mạnh tới cách các thành phố sử dụng công nghệ Dữ liệu lớn (Big Data) để quản lý du lịch tốt hơn.

    Câu chuyện Dữ liệu lớn và ngành du lịch

  18. Quay trở lại với chủ đề về Decision trees, thì ở 2 bài viết trước đã giới thiệu đến các bạn khái quát thế nào là thuật toán cây quyết định, bao gồm các thành phần, và một số công thức tính toán để lựa chọn các biến phân nhánh hay cách phân nhánh tối ưu, mục đích dự báo, phân loại, phân nhóm các đối tượng dữ liệu vào các nhóm, các lớp của biến mục tiêu sao cho chính xác nhất.

    THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.3): C4.5 (ENTROPY)

  19. Nếu các bạn hoạt động, làm việc trong lĩnh vực thương mại điện tử (E-commerce) hay digital marketing chắc biết đến Data management platform (DMP) còn được gọi là nền tảng quản lý dữ liệu tập trung.

    TẦM QUAN TRỌNG CỦA QUẢN LÝ DỮ LIỆU (DATA MANAGEMENT) (P1)

  20. Ở bài viết trước, phần 1 về ứng dụng Big Data trong lĩnh vực E-commerce, đã giới thiệu đến các bạn tổng quan về thị trường E-commerce, các định nghĩa, khái niệm về kinh doanh trực tuyến, đồng thời mô tả nguồn dữ liệu E-commerce có những đặc tính được coi là Big Data và nói lên nhu cầu khai thác.

    ỨNG DỤNG BIG DATA TRONG LĨNH VỰC E-COMMERCE (PHẦN 2)

  21. Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.

    THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES

  22. Phân tích dự báo hay còn gọi Predictive analytics là một trong những phương pháp, kỹ thuật phân tích dữ liệu phổ biến và quan trọng nhất ngày nay. Đây là công cụ hữu ích để những nhà khoa học, chuyên gia hoạt động ở lĩnh vực Data science có cái nhìn chi tiết về đối tượng nghiên cứu, khám phá các mối liên hệ, đưa ra những phán đoán về đối tượng nghiên cứu ở tương lai chứ không chỉ dừng lại tại quá trình mô tả.

    TỔNG QUAN VỀ PREDICTIVE ANALYTICS (PHÂN TÍCH DỰ BÁO) (PHẦN 1)

  23. KHI MỘT CHUYÊN GIA PHÂN TÍCH DỮ LIỆU NHẬN ĐƯỢC YÊU CẦU TỪ CÁC PHÒNG BAN, BỘ PHẬN HAY LÃNH ĐẠO CÔNG TY, CHUYÊN GIA ẤY CÓ THỂ NHẢY VÀO PHÂN TÍCH NGHIÊN CỨU NGAY VẤN ĐỀ. NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU SẼ MONG MUỐN TỪ YÊU CẦU ĐƠN GIẢN BAN ĐẦU SẼ TÌM RA PHÁT HIỆN TUYỆT VỜI, ĐƯA RA ĐƯỢC CÁC ĐỀ XUẤT HAY NHẤT ĐỂ ÁP DỤNG CHO CÔNG TY. NHƯNG THỰC TẾ THƯỜNG KHÔNG THUẬN LỢI NHƯ VẬY.

    Các bước chuẩn bị cho một dự án phân tích dữ liệu thành công!

  24. Quyển sách mới ra “hiểu số để tăng số – Sexy little number” của Dimitrix Maex & Paul B.Brown đưa ra một góc nhìn tổng hợp trong việc sử dụng số liệu để thực hiện tiếp thị marketing trong thời đại công nghiệp số hoá, dữ liệu lớn. Trong bài này chúng tôi sẽ tóm tắt 1 số ý chính từ quyển sách cho bạn không có thời gian đọc hết quyển sách này.

    Sử dụng số liệu trong kinh doanh thời đại số

  25. Trước tình hình biến động của nền kinh tế và sự phát triển của khoa học công nghệ, để người quản lý có thể đưa ra những quyết định khả thi, hiệu quả thì nguồn dữ liệu đóng vai trò khá quan trọng.

    DỮ LIỆU SƠ CẤP TRONG NGHIÊN CỨU MARKETING

ứng dụng quản lý vận tải thông minh

ứng dụng quản lý đội xe, điều tài thông minh

Phần mềm, ứng dụng thông minh dành cho quản lý xe doanh nghiệp, điều xe đi công tác,...

SGO Giải pháp thông minh cho các công ty vận chuyển, logistics thuê ngoài

fintech

banking mobile apps

insurtech

medical tech, health care mobile apps

Chuyển đổi số, Kinh tế số