10 công ty phân tích dữ liệu hàng đầu thế giới năm 2022

Theo thống kê của Techjury thực hiện năm 2021, nhờ có dữ liệu lớn mà Netflix tiết kiệm được 1 tỷ USD mỗi năm cho việc giữ chân khách hàng (thống kê của Techjury năm 2021). Thực tế, không chỉ có Netflix mà rất nhiều các ông lớn khác trên thế giới đều đang tập trung vào việc phát triển cơ sở dữ liệu và ứng dụng chúng vào các hoạt động phát triển kinh doanh. Vậy làm thế nào mà từ dữ liệu lớn lại có thể “sản sinh” ra hàng tỷ, thậm chí hàng chục tỷ USD? Bài viết này sẽ “bật mí” cùng bạn cách các ông lớn trên thế giới đang sử dụng dữ liệu.

Show

    1, Google

    Tính đến năm 2021, Google chiếm 87,35% thị phần công cụ tìm kiếm toàn cầu, với 1,2 nghìn tỷ lượt tìm kiếm mỗi năm và hơn 40.000 lượt mỗi giây. Hơn nữa, 15% tổng số tìm kiếm trên Google là mới và chưa từng được nhập trước đây! Vì vậy, rõ ràng, đây không phải là sự lặp lại cùng một tập thông tin. Thay vào đó, các bộ dữ liệu mới hơn được tạo ra liên tục mỗi ngày thông qua Google.

    Như vậy, Google chính là tên tuổi hàng đầu khi nhắc đến dữ liệu lớn. Công ty này đã phát triển thành công một số công cụ và kỹ thuật mã nguồn mở được sử dụng rộng rãi trong hệ sinh thái dữ liệu lớn hiện nay. Với sự trợ giúp của nhiều kỹ thuật dữ liệu lớn khác nhau, Google hiện có khả năng khám phá hàng triệu trang web và trả cho người dùng thông tin phù hợp chỉ trong vòng vài mili giây. 

    Để làm được điều này, mấu chốt nằm ở phân tích dữ liệu lớn. Các công cụ dữ liệu lớn được sử dụng để hiểu về yêu cầu của người dùng dựa trên một số thông số như lịch sử tìm kiếm, vị trí, xu hướng, v.v. Sau đó, thuật toán sẽ tiến hành các phép tính phức tạp để dễ dàng tìm kiếm, sắp xếp và xếp hạng các nội dung dựa trên mức độ liên quan và phù hợp với yêu cầu của người dùng. 

    Chỉ tính riêng nền tảng tìm kiếm, Google đã sử dụng hàng loạt các công cụ như: Indexed pages (tập hợp các trang được lập chỉ mục), Real-time Data Feeds (nguồn cấp dữ liệu thời gian thực), Sorting tools (lọc các câu hỏi mà người dùng nhập vào so với tất cả dữ liệu có sẵn nhằm xác định yêu cầu tìm kiếm), Knowledge Graph Pages (cơ sở tri thức của Google lấy người dùng làm trung tâm và cung cấp cho họ thông tin hữu ích có liên quan một cách nhanh chóng và dễ dàng), Literal & Semantic search (Tìm kiếm văn bản & ngữ nghĩa), Tracking Cookies (theo dõi các trang web mà người dùng đang truy cập để hu thập một số dữ liệu liên quan đến người dùng như sở thích, khuynh hướng, yêu cầu của họ),..

    Bên cạnh nền tảng tìm kiếm, Google cũng đang sử dụng dữ liệu lớn nhằm phục vụ các mô hình học máy, hỗ trợ trích xuất thông tin từ hình ảnh hay phát triển các sản phẩm thông minh như loa ứng dụng trợ lý ảo,…

    2, Netflix

    Năm 2019, với định giá hơn 164 tỷ USD, Netflix đã vượt qua Disney để trở thành công ty truyền thông được định giá cao nhất trên thế giới. Thành công của Netflix có thể đến từ tỷ lệ giữ chân khách hàng ấn tượng, 93% so với 64% của Hulu và 75% của Amazon Prime. Tuy nhiên, không chỉ khả năng giữ chân phần lớn trong số 151 triệu người đăng ký đã giúp họ thành công.

    Theo Netflix, hơn 75% hoạt động của người xem được thực hiện dựa trên các đề xuất được cá nhân hóa. Netflix thu thập một số điểm dữ liệu để tạo hồ sơ chi tiết về người đăng ký của mình. 

    Đáng kể nhất, Netflix thu thập dữ liệu phản hồi và tương tác của khách hàng đối với một chương trình truyền hình. Ví dụ: Netflix biết ngày giờ người dùng đã xem một chương trình, thiết bị được sử dụng, nếu chương trình bị tạm dừng, người dùng có tiếp tục xem sau đó không và họ mất bao lâu để xem hoàn thiện một chương trình, v.v.

    Netflix thậm chí nắm bắt được đâu là cảnh được mọi người xem nhiều lần, nội dung xếp hạng được đưa ra, số lượng tìm kiếm và nội dung tìm kiếm. Để thu thập tất cả dữ liệu này và khai thác nó hiệu quả, Netflix sử dụng phân tích dữ liệu, ví dụ thuật toán đề xuất các chương trình truyền hình và phim dựa trên sở thích của người dùng.

    Bên cạnh hệ thống đề xuất, dữ liệu lớn còn được Netflix sử dụng nhằm xây dựng và tùy chỉnh chiến lược Marketing. Ngoài việc thu thập dữ liệu về hành động của người đăng ký, Netflix cũng khuyến khích phản hồi từ người dùng của mình. Một hệ thống phản hồi là hệ thống thumbs up/thumbs down (thích hay không thích) sử dụng thay thế hệ thống xếp hạng, đã giúp cải thiện mức độ tương tác của khán giả với mức lợi nhuận đáng kể, cho phép họ tùy chỉnh thêm trang chủ của người dùng.

    3, Apple

    Lợi thế của Apple trong việc thu thập dữ liệu lớn nằm ở mức độ phổ biến của các sản phẩm mà hãng sản xuất. Dữ liệu được công ty sử dụng để quyết định đâu là cách tiếp cận người dùng tốt nhất trước các sản phẩm và dịch vụ mới của mình.

    Một trong các lĩnh vực hưởng lợi từ phân tích dữ liệu lớn là thiết kế ứng dụng. Bằng cách sử dụng dữ liệu lớn, Apple có thể khám phá cách mọi người đang sử dụng các ứng dụng và thay đổi thiết kế trong tương lai để phù hợp với xu hướng của khách hàng.

    Apple Watch là một ví dụ điển hình về chiến lược tận dụng dữ liệu lớn của Apple. Là thiết bị đeo thông minh, Apple Watch có tiềm năng lớn trong việc thu thập dữ liệu về các hoạt động thường ngày của người dùng. Cái bắt tay giữa Apple và IBM là một minh chứng cho thấy Apple đang tận dụng tối đa các dữ liệu y tế số. 

    Nhờ sử dụng phân tích dữ liệu lớn, các ứng dụng và sản phẩm của Apple có thể theo dõi sức khỏe của người dùng và cải thiện lối sống của họ. Thông tin thu thập được có thể được dùng trong quá trình phòng ngừa, điều trị bệnh, cũng như ngăn chặn sự lây lan nhanh chóng của dịch bệnh. Sự hợp tác này cũng nhằm mục đích tạo ra các ứng dụng di động liên quan đến sức khỏe có thể được sử dụng với các thiết bị của Apple.

    Bên cạnh Apple Watch, dữ liệu lớn cũng là một phần đặc biệt quan trọng trong việc phát triển và nâng cấp trợ lý ảo Siri. Năm 2020, với thông báo rằng Apple sẽ mở Siri cho các nhà phát triển bên thứ ba, gã khổng lồ công nghệ sẽ sớm có thể nắm bắt dữ liệu về cách thức và thời điểm mọi người sử dụng các ứng dụng như Uber, SnapChat, Skype và nhiều hơn nữa. Nguồn thông tin mới này sẽ giúp Apple tiếp tục xác định những sản phẩm nào nên được phát triển và phát hành trong tương lai, để cải thiện các dịch vụ hiện tại và quyết định những gì nên loại bỏ khỏi dòng sản phẩm.