Home
» Wiki
»
Dokumentasi Terbitan Google Secara Tidak Sengaja tentang Cara Carian Berfungsi
Dokumentasi Terbitan Google Secara Tidak Sengaja tentang Cara Carian Berfungsi
Pada hari Isnin, dokumen dalaman yang menerangkan faktor yang dipertimbangkan oleh Carian Google apabila kedudukan dan paparan hasil web dibocorkan.
Google secara tidak sengaja mendedahkan cara Carian berfungsi
Dokumen-dokumen ini telah diumumkan oleh Rand Fishkin dari SparkToro, sebuah syarikat perisian. Fiskin sebelum ini bekerja dalam industri pengoptimuman enjin carian (SEO).
"Repositori Kandungan Google API" ini mengandungi dokumentasi API dalaman yang menerangkan kepada pekerja cara komponen berbeza yang menjana hasil carian berfungsi. Terdapat lebih 2,500 muka surat kesemuanya. Sesetengahnya menerangkan sistem lama, tetapi dokumen lain nampaknya dikemas kini.
Berdasarkan apa yang telah diterbitkan, Google nampaknya telah menyediakannya secara terbuka — mungkin secara tidak sengaja — melalui GitHub bermula pada 27 Mac. Dokumen penjelasan kemudiannya dikeluarkan pada 7 Mei. Walau bagaimanapun, kerana ia telah diindeks oleh perkhidmatan pihak ketiga pada sekitar masa itu, salinannya kekal tersedia walaupun selepas Google mengalih keluarnya.
Walaupun data ini menunjukkan faktor yang boleh dipertimbangkan oleh Carian Google semasa menentukan kedudukan hasil carian, data ini tidak mendedahkan betapa pentingnya setiap faktor kepada kedudukan akhir.
Mereka dalam komuniti SEO yang cuba menyesuaikan diri dengan perubahan dalam kedudukan Carian Google dan muncul lebih tinggi pada halaman mungkin mendapati data ini berguna. Selepas menyemak dokumen ini, mereka mendapati dokumen itu bercanggah dengan apa yang Google katakan secara terbuka tentang cara Carian berfungsi.
Google masih belum mengulas secara terbuka mengenai kebocoran itu. Syarikat itu mengumumkan kemas kini utama terbaharunya untuk Carian pada bulan Mac, dengan tujuan untuk menunjukkan kandungan yang lebih tulen dan "berguna". Sistem kedudukan terasnya telah dikemas kini untuk menentukan sama ada halaman "dibina untuk enjin carian dan bukannya untuk orang . "
Penemuan terbesar dalam kebocoran
Satu perkara yang jelas: algoritma Carian Google tidak dibocorkan dan pakar SEO tidak tiba-tiba mempunyai semua jawapan. Tetapi maklumat yang bocor dalam beribu-ribu dokumen dalaman Google masih besar. Ini adalah tinjauan yang tidak pernah berlaku sebelum ini terhadap kerja dalaman Google yang biasanya dikawal rapi.
Tapak web bergantung pada trafik carian untuk bertahan, dan banyak yang akan berusaha keras – dan perbelanjaan yang besar – untuk mengalahkan pesaing mereka dan naik ke puncak keputusan. Kedudukan yang lebih baik bermakna lebih banyak trafik tapak web, yang bermakna lebih banyak wang. Akibatnya, pengendali laman web memantau dengan teliti setiap perkataan yang diterbitkan oleh Google, serta setiap siaran media sosial, mengenai kedudukan carian.
Selama bertahun-tahun, jurucakap Google telah berulang kali menafikan bahawa klik pengguna mempengaruhi cara laman web ditarafkan — tetapi dokumen yang bocor telah menyatakan bahawa jenis klik pengguna tertentu menjadi faktor dalam kedudukan carian. Testimoni daripada kes antitrust Jabatan Kehakiman AS sebelum ini mendedahkan faktor kedudukan yang dipanggil Navboost yang menggunakan klik pengguna untuk meningkatkan kandungan dalam carian.
"Bagi saya, perkara yang paling penting ialah banyak kenyataan awam Google tentang perkara yang mereka kumpulkan dan cara enjin carian mereka berfungsi bertentangan dengan realiti," Rand Fishkin, pakar dalam industri pengoptimuman enjin carian (SEO), memberitahu The Verge melalui e-mel .
Kebocoran itu mula menjadi tular selepas pakar SEO Fishkin dan Mike King menerbitkan beberapa kandungan dokumen sulit itu awal minggu ini, bersama dengan analisis yang disertakan. Dokumen API yang bocor termasuk repositori yang diisi dengan maklumat dan takrifan tentang data yang dikumpul oleh Google, beberapa daripadanya boleh memaklumkan cara tapak web ditarafkan dalam hasil carian. Google pada mulanya mengelak soalan mengenai kesahihan dokumen yang bocor sebelum mengesahkannya secara rasmi pada Rabu lalu.
"Kami berhati-hati terhadap membuat andaian yang tidak tepat tentang Carian berdasarkan maklumat di luar konteks, lapuk atau tidak lengkap," kata jurucakap Google Davis Thompson kepada The Verge dalam e-mel pada hari Rabu. "Kami telah berkongsi maklumat yang luas tentang cara Carian berfungsi dan jenis faktor yang dipertimbangkan oleh sistem kami, dan kami berusaha untuk melindungi integriti hasil kami daripada manipulasi . "
Tiada tempat dalam dokumentasi yang bercakap tentang cara menimbang atribut yang berbeza. Mungkin juga beberapa sifat yang dinamakan dalam dokumentasi—seperti pengecam untuk "tapak peribadi kecil" atau penurunan taraf untuk ulasan produk—mungkin telah dilaksanakan pada satu ketika, tetapi kemudian dialih keluar. Mereka juga mungkin tidak pernah digunakan untuk menentukan kedudukan laman web.
"Kami tidak semestinya tahu bagaimana [unsur-unsur] digunakan, selain daripada pelbagai penerangan mengenainya. Walaupun ia tidak begitu kaya, ia masih banyak maklumat untuk kami," kata King. “Apakah aspek yang perlu kita fikirkan secara lebih khusus apabila membuat tapak web atau mengoptimumkan tapak web?”.
Idea bahawa platform carian terbesar di dunia tidak menilai hasil carian berdasarkan cara pengguna berinteraksi dengan kandungan kelihatan tidak masuk akal. Tetapi penafian berulang-ulang, jawapan yang ditulis dengan teliti, dan penerbitan industri menjadikannya topik yang kontroversi.
Satu lagi perkara penting Fishkin dan King menyerlahkan kebimbangan bagaimana Google boleh menggunakan data Chrome dalam kedudukan cariannya. Wakil Carian Google telah mengatakan bahawa mereka tidak menggunakan apa-apa daripada Chrome untuk kedudukan, tetapi dokumen yang bocor menunjukkan bahawa ia mungkin tidak benar. Sebagai contoh, satu bahagian menyenaraikan "chrome_trans_clicks" untuk menunjukkan pautan dari domain yang muncul di bawah tapak utama dalam hasil carian. Fishkin menerangkan bahawa ini bermakna Google "mengambil bilangan klik pada halaman dalam penyemak imbas Chrome dan menggunakan nombor itu untuk menentukan URL paling popular/penting di tapak, yang kemudiannya dikira untuk dimasukkan dalam ciri pautan tapak . "
Terdapat lebih 14,000 hartanah yang disebut dalam dokumen dan penyelidik perlu menggali selama berminggu-minggu untuk mencari petunjuk yang terkandung dalam halaman tersebut. "Twiddlers" atau tweak kedudukan digunakan di luar kemas kini sistem utama untuk menaikkan atau menurunkan kandungan mengikut kriteria tertentu. Elemen tapak, seperti siapa pengarang, dilindungi, serta ukuran "pihak berkuasa" tapak. Fishkin menunjukkan bahawa terdapat banyak perkara yang tidak diwakili dalam dokumen, seperti maklumat tentang hasil carian yang dijana AI.
Jadi apa maksud semua ini? Pertama, mungkin sesiapa yang menjalankan laman web akan membaca tentang kebocoran ini dan cuba memahaminya. Penerbit, syarikat e-dagang dan perniagaan mungkin akan mereka bentuk pelbagai eksperimen untuk mencuba menguji beberapa perkara yang dicadangkan dalam dokumen. Apabila ini berlaku, tapak web boleh mula berasa sedikit berbeza — semuanya semasa mereka cuba memahami gelombang maklumat baharu, namun masih samar-samar ini.
"Wartawan dan penerbit yang membuat liputan SEO dan Carian Google perlu berhenti melontarkan kenyataan awam Google dan melihat dengan lebih dekat, lebih bermusuhan pada retorik gergasi carian itu," kata Fishkin . "Penerbitan yang mengulangi dakwaan Google seolah-olah ia adalah fakta hanya membantu Google mencipta naratif yang berguna kepada syarikat, tidak membantu pengamal, pengguna atau orang ramai."