Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Video Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Anda boleh mengimport data dari mana-mana halaman web menggunakan fungsi ImportXML Google Sheets. Inilah caranya menggunakan fungsi ImportXML pada Helaian Google.

Dengan menguasai fungsi ImportXML Google Sheet, anda akan merasa seperti anda sudah memiliki Wizard Penyelidik yang disahkan. ImportXML memperoleh maklumat dari mana-mana medan XML. Terima kasih kepada itu, anda boleh memuat turun data dan metadata yang dihasilkan di mana-mana sahaja.

Asas XML dan HTML

Bahasa markup XML menentukan set data dalam halaman web. Pada dasarnya, sebarang set <something> and </ something> - blok bangunan kod sumber web atau set data tertentu akan berada di dalamnya. Kod sumber web akan mempunyai beberapa teks dalam tag perenggan - perenggan, kadang mengandungi <b> lama - dalam teks tebal dan mungkin <a> pautan - pautan (diikuti oleh </ a > </ b>. </ p> </ body> untuk menutup seluruh teg).

Fungsi Sheet ImportXML Google boleh mencari set data XML tertentu dan menyalin data di luarnya. Dalam contoh di atas, jika kami ingin mendapatkan semua pautan di halaman, kami perlu meminta fungsi ImportXML untuk memasukkan semua maklumat dalam tag <a> </a> . Sekiranya anda mahu keseluruhan teks web, anda boleh mulakan dengan mengambil segala-galanya dalam <body> </ body> atau setiap versi <p> </ p> , kemudian memadam data pada peringkat kemudian.

Bagaimana untuk mengekstrak senarai kod pos dan daerah di bandar

Jadual-jadual di Wikipedia adalah latihan ImportXML yang hebat. Artikel ini akan mengambil contoh memuat turun keseluruhan kod pos di Edmonton, Alberta. Cari senarai poskod Kanada yang bermula dengan huruf T. Buka halaman itu dalam tetingkap penyemak imbas baru untuk bermula.

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Pilih kod pos, klik kanan padanya dan pilih Semak untuk membuka alat penyemak imbas untuk melihat sumber halaman. Anda akan melihat setiap kod sumber halaman dalam tag (mengenal pasti sel di dalam jadual). Selepas itu, artikel itu akan mengimport semua tag TD yang terdapat di Edmonton di dalamnya.

Buat Lembaran Google kosong baharu. Artikel ini akan mengambil semua konten tag TD, termasuk <span> dan tautan dengan menentukan data yang ingin Anda gunakan sintaks XPath. ImportXML mengambil URL dan tag yang anda cari sebagai hujah untuk diimport ke Helaian Google.

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td")

Anda akan mendapat hasil berikut:

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Kembali ke sumber halaman, kami akan melihat kod pos dengan huruf tebal dalam tag <b> </ b>, nama bandar yang dihubungkan dengan artikel Wikipedia di bawah <a> </a>. Kini cuba mendapatkan pautan hanya di setiap kotak bandar besar dan alih keluar pautan lain (kejiranan). Editnya ke dalam dua perintah utama lajur A dan B:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1]")

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / b [1]")

Anda perlu menyempurnakan hasilnya sedikit:

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Tindakan ini membantu anda memahami bagaimana sintaks pertanyaan query XPath: satu tag hanya menyediakan versi pertama <tag> dalam <parent tag>. Oleh itu, td / span / a [1] memberi anda pautan pertama pada <span> pada setiap <td>. Begitu juga, td / b [1] memberi anda teks tebal pertama dalam setiap <td> atau hanya kod pos dalam kes ini.

Perkara yang menarik ialah anda boleh melaksanakan dua pertanyaan dalam satu fungsi. Oleh itu, artikel itu menggabungkan dua permintaan dengan simbol | | di tengah:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td / span / a [1] | // td / b [1]")

Walau bagaimanapun, anda tidak akan mendapat hasil yang sama sebelumnya. Ia akan menggantikan keseluruhan permintaan digabungkan ke dalam senarai panjang, bukannya dua lajur. Ia mempunyai banyak faedah tetapi tidak perlu dalam artikel ini.

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Untuk memilih kod pos di dalam kotak yang mengandungi pautan 'Edmonton'. Kami akan menggunakan kod ini:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / b [1]")

Letakkan "carian" - teks yang layak untuk menyempitkan keputusan dalam kurungan persegi tanpa menjejaskan cara untuk membawa hasil.

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Kini untuk nama-nama kawasan berdekatan. Tulis fungsi importXML yang sesuai di lajur seterusnya, dapatkan teks berikut dari "Edmonton."

Artikel ini mengambil keseluruhan kandungan rentang [1] dan menggunakan tanda kurung dan rentetan untuk membagi kandungan, meletakkan "Edmonton" di lajur pertama dan nama kejiranan dalam lajur berikut. Kami kemudian boleh menggabungkan kod pos dengan nama yang sepadan:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada", "// td [span / a = 'Edmonton'] / span [1]")

Seterusnya, gunakan fungsi Split dan concatenate beberapa lajur berikut untuk berpecah & kumpulan data yang diproses:

= SPLIT (concatenate (B2: J2), "(/)")

Akhirnya, di sini adalah jadual keputusan dengan maklumat yang diperlukan:

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Cara menyalin alamat e-mel secara automatik dari web

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Artikel ini akan membimbing anda bagaimana untuk mendapatkan e-mel semua ejen tentang Mengenai | halaman Zapier. Melihat kod sumber, anda akan melihat alamat e-mel setiap ahli berada dalam medan kelas = "e-mel". Apabila anda ingin menentukan atribut tag, gunakan fungsi Import GoogleML Sheets seperti berikut:

= importxml ("https://zapier.com/about//", "// span [@ class = 'email']")

Cara menggunakan Regex untuk mengimport alamat e-mel dari web dalam Helaian Google.

Untuk mendapatkan alamat Zapier menggunakan "kuasa" Regex, kami akan memasukkan perintah <span> dan bukannya mencari kelas. Sekarang kita akan melaksanakan tugas ini dalam dua langkah: Maklumat panggilan dari halaman Zapier ke lajur pertama, kemudian, isikan e-mel ke lajur kedua:

= importxml ("https://zapier.com/about//", "// span")

= regexextract (A1, "[a-zA-Z0-9 _ \. \ + -] + @ [a-zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2, 15} ")

Akhirnya, kita akan mempunyai jadual ini:

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Ingat, ImportXML mengisi semua lajur dan baris dengan sendirinya bergantung pada data yang diperolehnya. Pertanyaan regex mesti diisi dalam setiap sel yang anda ingin dapatkan hasilnya. Untuk memasukkannya bersama-sama, anda hanya perlu menggunakan arahan Regexextract , iaitu rumusan berterusan pelbagai:

= ArrayFormula (IFERROR (REGEXEXTRACT (IMPORTXML ("https://zapier.com/about//", "// span"), "[a-zA-Z0-9 _ \. \ + -] + @ [a- zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2,15} "))))

Dan inilah hasilnya:

Cara menggunakan fungsi Import Sheet Google Sheets untuk mengumpulkan data di mana-mana sahaja

Harap artikel ini membantu anda!

Ribuan pekerja Sony akan dipecat tahun ini

Ribuan pekerja Sony akan dipecat tahun ini

Sony berada dalam keadaan paling sukar dan merancang untuk memotong lebih daripada 1,000 pekerjaan dari bahagian telefon bimbitnya.

Rahsia membersihkan porselin adalah seperti menyambut Tet

Rahsia membersihkan porselin adalah seperti menyambut Tet

Setelah sekian lama digunakan, teko seramik sering kotor dan kusam, menyebabkan hilangnya estetika. Bagaimana membersihkan tembikar dan porselin lama seperti Tahun Baru?

WiFi Better Battery - aplikasi yang membantu menjimatkan kuasa bateri ketika menggunakan wifi pada telefon pintar

WiFi Better Battery - aplikasi yang membantu menjimatkan kuasa bateri ketika menggunakan wifi pada telefon pintar

Telefon sentiasa mencari hotspot Wi-Fi di sekitar akan menghabiskan sejumlah besar bateri pada telefon pintar.

Cip Snapdragon 810 lebih sejuk daripada Snapdragon 801

Cip Snapdragon 810 lebih sejuk daripada Snapdragon 801

Walaupun khabar angin mengenai Snapdragon 810 mengatakan itu panas, tampaknya ada bukti bahawa khabar angin ini akan segera berakhir.

HTC One M9 muncul dengan kelompok kamera yang melampau

HTC One M9 muncul dengan kelompok kamera yang melampau

Maklumat yang berkaitan dengan HTC One M9 (juga dikenal sebagai Hima) telah meningkat menjadi raksasa dalam waktu yang singkat.

Keistimewaan pemanas air

Keistimewaan pemanas air

Keistimewaan pemanas air adalah pam kuasa yang mengekalkan bekalan air yang stabil, sistem sensor terma yang selamat dan pancuran antibakteria.

Iklan baru Microsoft memaparkan Lumia 1330

Iklan baru Microsoft memaparkan Lumia 1330

Khabar angin mengenai Lumia 1330, penerus Lumia 1320, terus ditambah dengan iklan dari Microsoft.

Mengesan versi RAM Lumia 635 hingga 1 GB

Mengesan versi RAM Lumia 635 hingga 1 GB

Sekiranya anda ingat, Lumia 635 dilancarkan tahun lalu dengan RAM 512MB di dalamnya, tetapi peranti ini akan ditingkatkan untuk menggandakan RAM.

Apple membuka Kedai terbesarnya di China

Apple membuka Kedai terbesarnya di China

Tidak lama dahulu, Apple mengumumkan dan menerbitkan gambar-gambar menarik dari sebuah kedai yang akan dibuka di Xihu di Hangzhou, China.

Sistem penghilang bau Deo Fresh pada peti sejuk Electrolux

Sistem penghilang bau Deo Fresh pada peti sejuk Electrolux

Sistem penyahbauan Deo Fresh merangkumi sistem penghilang bau dwi dan beg kawalan bau, membantu peti sejuk menghilangkan bau yang tidak menyenangkan, membawa udara segar ke dalam.

iPad dalam masa sukar

iPad dalam masa sukar

Semasa iPhone berada di puncaknya, Ming-Chi Kuo telah meramalkan bahawa penjualan iPad tidak sebaik iPhone.

Mengapa mesti membeli TV Sony?

Mengapa mesti membeli TV Sony?

TV Sony tidak hanya terkenal dengan banyak teknologi paparan eksklusif, tetapi juga menarik pengguna dengan ciri-ciri bergaya 3D View, resolusi 4K, ...

Nexus 6 dan Note 4 mempunyai markah Penanda Aras tertinggi hari ini

Nexus 6 dan Note 4 mempunyai markah Penanda Aras tertinggi hari ini

Dari segi daya pemprosesan grafik untuk permainan, chipset Tegra K1 NVIDIA dan Qualcomm Snapdragon 805 mendahului perlumbaan.

Telefon pintar LED flash kamera Lenovo 3-LED terdedah

Telefon pintar LED flash kamera Lenovo 3-LED terdedah

Garis Vibe Lenovo baru sahaja menambah ahli baru, Vibe Shot, dengan reka bentuk yang indah, bingkai aluminium dan kamera 16MP.

Jangan ragu untuk makan dan bermain selepas Tet, tidak takut untuk menambah berat badan

Jangan ragu untuk makan dan bermain selepas Tet, tidak takut untuk menambah berat badan

Selepas Tet, sangat tidak selesa untuk menjauhi diet, untuk menjaga berat badan anda sebelum dan selepas Tet, anda tidak perlu berdiet, ikuti beberapa petua.

Apa yang perlu dilakukan untuk mengejar kerja selepas Tet?

Apa yang perlu dilakukan untuk mengejar kerja selepas Tet?

Ramai orang merasa lembap setelah melalui percutian Tet yang panjang. Bersama dengan WebTech360, pelajari beberapa "trik" untuk mengejar kerja dengan cepat selepas Tet.

5 petua membeli-belah yang sangat menjimatkan untuk Tahun Baru Imlek

5 petua membeli-belah yang sangat menjimatkan untuk Tahun Baru Imlek

5 petua untuk membantu keluarga anda membeli percutian Tet ini dengan berkesan dan ekonomi.

Ketahui mengenai sistem operasi Mac OS Apple

Ketahui mengenai sistem operasi Mac OS Apple

Mac OS dikenali sebagai platform sistem operasi yang lancar dan dioptimumkan dengan antara muka yang indah. Walaupun tidak sepopular Windows, platform ini mempunyai kestabilan, keselamatan tinggi dan merupakan sistem operasi yang sesuai untuk pengguna.

Candy Crush Saga - Permainan mudah alih menghasilkan pendapatan lebih dari $ 1 bilion tahun lalu

Candy Crush Saga - Permainan mudah alih menghasilkan pendapatan lebih dari $ 1 bilion tahun lalu

Di antara permainan mudah alih paling popular dan dimuat turun pada tahun lalu, Candy Crush Saga telah mencapai penjualan yang besar.

Akan datang telefon pintar paling nipis di dunia yang pernah ada

Akan datang telefon pintar paling nipis di dunia yang pernah ada

Telefon pintar nipis menjadi trend biasa bagi banyak pengeluar China, walaupun sangat tipis sehingga pengguna benar-benar takut.