top of page
Tìm kiếm
Ảnh của tác giảĐàm Triệu Vinh

YouTube thống trị Google Video vào năm 2020


Trong một nghiên cứu với 2,1 triệu lượt tìm kiếm và 766 nghìn video, YouTube chiếm 94% tổng số kết quả băng chuyền video trên trang một của Google, không để lại nhiều cạnh tranh.

Ngay cả những người đam mê video bình thường nhất cũng biết đến YouTube (được Google mua lại vào năm 2006). Là một người dùng tìm kiếm của Google, bạn thậm chí có thể cảm thấy như bạn gặp nhiều video YouTube hơn video từ các nguồn khác, nhưng dữ liệu có sao lưu điều này không?

Một bài báo của Wall Street Journal vào tháng 6 năm 2020 đã đánh giá lợi thế mạnh mẽ của YouTube trong kết quả tìm kiếm của Google, nhưng bài báo đó tập trung vào 98 video được chọn lọc thủ công để so sánh YouTube với các nền tảng khác.

Sử dụng một tập hợp hơn hai triệu tìm kiếm trên máy tính để bàn của Google.com.vn (Hoa Kỳ) được ghi lại vào đầu tháng 10 năm 2020, chúng tôi có thể trích xuất hơn 250.000 kết quả bằng băng chuyền video trên trang một. Hầu hết các kết quả video không phải trả tiền vào năm 2020 đều xuất hiện trong một băng chuyền, như sau:

Băng chuyền này xuất hiện trên tìm kiếm “Cách trở thành nhà đầu tư” (Bước 1: Tìm một túi tiền). Lưu ý mũi tên ở ngoài cùng bên phải – hiện tại, người tìm kiếm có thể cuộn qua tối đa mười video. Trong khi nghiên cứu của chúng tôi theo dõi tất cả mười vị trí, hầu hết báo cáo này sẽ tập trung vào ba vị trí có thể nhìn thấy.

YouTube chiếm ưu thế như thế nào?

Thông thường, chúng tôi thấy YouTube xuất hiện rất nhiều trong kết quả của Google, nhưng chúng chiếm ưu thế như thế nào trong ba kết quả băng chuyền video hiển thị trên tập dữ liệu của chúng tôi? Đây là bảng phân tích:

Sự hiện diện của YouTube trên ba vùng video đầu tiên rất nhất quán, ở mức (1) 94,1%, (2) 94,2% và (3) 94,2%. Khan Academy và Facebook đã giành vị trí thứ 2 và thứ 3 cho mỗi vị trí băng chuyền, trong đó Facebook giành được thị phần ở các vị trí sau đó.

Rõ ràng, đây là một sự sụt giảm lớn từ thị phần lớn thứ nhất đến thứ hai và sự hiện diện của YouTube chỉ thay đổi từ 94,1% đến 95,1% trên tất cả mười vị trí. Trên tất cả các video hiển thị trong băng chuyền, đây là mười trang web hàng đầu trong tập dữ liệu của chúng tôi:

  1. YouTube (94,2%)

  2. Học viện Khan (1,5%)

  3. Facebook (1,4%)

  4. Microsoft (0,4%)

  5. Vimeo (0,1%)

  6. Twitter (0,1%)

  7. Thời gian hàng ngày (<0,1%)

  8. CNBC (<0,1%)

  9. CNN (<0,1%)

  10. ESPN (<0,1%)

Lưu ý rằng do những hạn chế về mặt kỹ thuật đối với cách hoạt động của trình thu thập thông tin tìm kiếm, nhiều video trên Facebook và Twitter yêu cầu đăng nhập và không khả dụng với Google. Điều đó nói lên rằng, những người chơi lớn nhất từ ​​thứ 2 đến thứ 10 trong băng chuyền video – bao gồm một số thương hiệu lớn có túi tiền sâu cho nội dung video – chỉ thêm tới 3,7% video hiển thị.

Làm thế nào về làm thế nào-để?

Xin lỗi ngữ pháp của tôi, nhưng “Làm thế nào để …?” các câu hỏi đã trở thành điểm nóng cho các kết quả video, và đương nhiên là cho những người chơi thích hợp như HGTV. Đây là một băng chuyền video từ tìm kiếm “cách tổ chức phòng đựng thức ăn”:

Bề ngoài có vẻ hứa hẹn, nhưng liệu ngách này có cho thấy sự đa dạng hơn của các trang web trên quy mô lớn không? Tập dữ liệu của chúng tôi chỉ bao gồm hơn 45.000 lượt tìm kiếm “Cách…” bằng băng chuyền video. Dưới đây là bảng phân tích về ba trang web hàng đầu cho mỗi vị trí:

Trong tập dữ liệu của chúng tôi, YouTube thậm chí còn chiếm ưu thế hơn trong phân khúc hướng dẫn cách tiếp cận, chiếm từ 97-98% mỗi vị trí trong số ba vị trí hiển thị. Khan Academy đứng ở vị trí thứ hai và Microsoft (cụ thể là trang web hỗ trợ của Microsoft) đã làm tròn vị trí thứ ba (nhưng ở mức <1% trong cả ba vị trí).

Đây chỉ là một trò may rủi?

Phần lớn phân tích này dựa trên ảnh chụp nhanh dữ liệu vào đầu tháng 10. Cho rằng Google thường xuyên thực hiện các thay đổi và chạy hàng nghìn bài kiểm tra mỗi năm, chúng ta có thể chọn một ngày đặc biệt bất thường không? Để trả lời điều đó, chúng tôi đã xác định mức độ phổ biến của YouTube trên tất cả các video trong băng chuyền vào ngày đầu tiên của mỗi tháng của năm 2020:

Sự thống trị của YouTube khá ổn định trong năm 2020, dao động từ 92,0% đến 95,3% trong tập dữ liệu của chúng tôi (và thực sự tăng lên một chút kể từ tháng 1). Rõ ràng, đây không phải là tình trạng tạm thời hay đặc biệt gần đây.

Một thách thức khác trong việc nghiên cứu kết quả của Google, ngay cả với các tập dữ liệu lớn, là khả năng lấy mẫu sai lệch. Không có mẫu kết quả tìm kiếm thực sự “ngẫu nhiên” (thêm về mẫu này trong Phụ lục A), nhưng chúng tôi đủ may mắn để có tập dữ liệu thứ hai có lịch sử lâu đời. Mặc dù tập dữ liệu này chỉ có 10.000 từ khóa, nhưng nó được thiết kế đặc biệt để đại diện đồng đều cho các danh mục ngành trong Google Ads. Vào ngày 9 tháng 10, chúng tôi có thể thu được 2.390 băng chuyền video từ tập dữ liệu này. Đây là cách họ đo lường:

Ba trang web hàng đầu trong mỗi vị trí băng chuyền giống hệt với tập dữ liệu 2 triệu từ khóa và sự thống trị của YouTube thậm chí còn cao hơn (tăng từ 94% lên 96%). Chúng tôi tin chắc rằng mức độ phổ biến của các kết quả YouTube được đo lường trong nghiên cứu này không phải là sự xuất hiện của một ngày hay một tập dữ liệu duy nhất.

Cấp độ như thế nào là lĩnh vực?

YouTube có lợi thế không công bằng không? “Công bằng” là một khái niệm khó định lượng, vì vậy hãy cùng khám phá quan điểm của Google.

Lập luận đầu tiên của Google có lẽ là YouTube có tỷ lệ chia sẻ kết quả video lớn nhất vì họ lưu trữ tỷ lệ chia sẻ video của sư tử. Thật không may, thật khó để có được những con số đáng tin cậy trên toàn bộ thế giới lưu trữ video và đặc biệt là cho các nền tảng xã hội. YouTube chắc chắn là một người chơi lớn và có khả năng lưu trữ phần lớn các video công khai, phi xã hội ở Hoa Kỳ, nhưng 94% dường như là một phần lớn ngay cả đối với sư tử.

Vấn đề lớn hơn là sự thống trị này trở nên tự tồn tại. Trong vài năm qua, nhiều công ty lớn đã lưu trữ video trên YouTube và tạo kênh YouTube vì việc nhận kết quả trong tìm kiếm của Google dễ dàng hơn so với lưu trữ trên các nền tảng nhỏ hơn hoặc trang web của riêng họ.

Lập luận kỹ thuật hơn của Google là thuật toán tìm kiếm video không có ưu tiên cố hữu cho YouTube. Là một nhà tiếp thị tìm kiếm, tôi đã học cách xem đối số này một cách hạn hẹp. Có lẽ không có một dòng mã nào trong thuật toán có nội dung như:

IF site = ‘YouTube’ THEN ranking = 1

Được định nghĩa trong phạm vi hẹp, tôi tin rằng Google đang nói sự thật. Tuy nhiên, không thể thoát khỏi thực tế rằng Google và YouTube có chung một xương sống và nhiều cơ quan nội tạng giống nhau, điều này mang lại những lợi thế không thể vượt qua.

Ví dụ: thuật toán video của Google có thể thưởng cho tốc độ. Điều này có ý nghĩa – video tải chậm là một trải nghiệm khách hàng không tốt và khiến Google trông tệ hại. Đương nhiên, quyền sở hữu trực tiếp của Google đối với YouTube có nghĩa là quyền truy cập của họ vào dữ liệu YouTube nhanh như chớp. Trên thực tế, làm cách nào mà một đối thủ cạnh tranh, ngay cả với hàng tỷ USD đầu tư, lại có thể tạo ra trải nghiệm nhanh hơn so với đường dẫn trực tiếp đến Google? Tương tự như vậy, cấu trúc dữ liệu của YouTube đương nhiên sẽ được tối ưu hóa để Google có thể dễ dàng xử lý và tiêu hóa, dựa trên kiến ​​thức nội bộ có thể không có sẵn cho tất cả người chơi.

Hiện tại, từ góc độ tiếp thị, chúng tôi không còn lựa chọn nào khác ngoài việc bao quát các cơ sở của mình và tận dụng lợi thế mà YouTube dường như mang lại. Không có lý do gì chúng ta nên mong đợi số lượng của YouTube giảm và mọi lý do để mong đợi sự thống trị của YouTube sẽ tăng lên, ít nhất là không có sự gián đoạn chuyển đổi mô hình đối với ngành.

Rất cảm ơn Eric H. và Michael G. trong nhóm Vancouver của chúng tôi đã chia sẻ kiến ​​thức của họ về tập dữ liệu và cách giải thích nó, cũng như Eric và Rob L. vì đã tin tưởng cho tôi truy cập Athena vào kho dữ liệu.

Phụ lục A: Dữ liệu và phương pháp luận

Phần lớn dữ liệu cho nghiên cứu này được thu thập vào đầu tháng 10 năm 2020 từ một tập hợp chỉ hơn hai triệu kết quả tìm kiếm trên máy tính để bàn của Google.com, có trụ sở tại Hoa Kỳ. Sau khi khử trùng lặp nhỏ và làm sạch, tập dữ liệu này đã mang lại 258 nghìn lượt tìm kiếm với băng chuyền video trên trang một. Các băng chuyền này chiếm 2,1 triệu tổng số kết quả / URL video và 767K kết quả hiển thị (Google hiển thị tối đa ba kết quả trên mỗi băng chuyền mà không cần cuộn).

Phân tích cách thực hiện dựa trên một tập dữ liệu nhỏ hơn gồm 45 nghìn từ khóa bắt đầu một cách rõ ràng bằng các từ “cách thực hiện”. Cả tập dữ liệu đều không phải là mẫu được chọn ngẫu nhiên và có thể thiên về các ngành hoặc ngành dọc nhất định.

Tập dữ liệu 10K tiếp theo được xây dựng cụ thể như một tập dữ liệu nghiên cứu và được phân bổ đồng đều trên 20 danh mục ngành chính trong Google Ads. Tập dữ liệu này được thiết kế đặc biệt để thể hiện một loạt các thuật ngữ cạnh tranh.

Tại sao chúng ta không sử dụng lấy mẫu ngẫu nhiên thực sự? Bên ngoài sách giáo khoa, hiếm khi đạt được một mẫu ngẫu nhiên thực sự, nhưng về mặt lý thuyết thì có thể. Ví dụ, chọn một mẫu ngẫu nhiên gồm người lớn ở Hoa Kỳ là vô cùng khó (ngay khi bạn nhấc điện thoại hoặc gửi email, bạn đã giới thiệu thành kiến), nhưng ít nhất chúng tôi biết rằng, tại bất kỳ thời điểm cụ thể nào , dân số người trưởng thành ở Hoa Kỳ là một tập hợp hữu hạn các cá nhân.

Điều này cũng không đúng với các tìm kiếm trên Google. Các tìm kiếm không phải là một tập hợp hữu hạn, mà là một đám mây các từ được người tìm kiếm gợi ra từ khoảng trống mỗi mili giây. Theo bản thân Google: “Có hàng nghìn tỷ lượt tìm kiếm trên Google mỗi năm. Trên thực tế, 15% các tìm kiếm mà chúng tôi thấy hàng ngày là mới ”. Số lượng tìm kiếm không chỉ ở mức hàng nghìn tỷ mà còn thay đổi từng phút.

Cuối cùng, chúng tôi dựa vào các tập dữ liệu lớn, nếu có thể, cố gắng hiểu những sai sót trong bất kỳ tập dữ liệu nhất định nào và sao chép công việc của chúng tôi trên nhiều tập dữ liệu. Nghiên cứu này được lặp lại dựa trên hai tập dữ liệu rất khác nhau, cũng như tập hợp thứ ba được tạo bởi một phần chuyên đề của tập đầu tiên và được xác thực với nhiều ngày vào năm 2020.





650 lượt xem0 bình luận

Bài đăng gần đây

Xem tất cả

Comments


bottom of page