Google Bercakap Tentang Kepentingan Sumber Terbuka Dan Data Terbuka Dalam Catatan Blog Terkini

Teknologi / Google Bercakap Tentang Kepentingan Sumber Terbuka Dan Data Terbuka Dalam Catatan Blog Terkini 3 minit membaca

Google



Google sebagai syarikat sentiasa menyokong perisian dan data sumber terbuka, sekurang-kurangnya dalam pendirian mereka. Ini hampir menjadi trend dengan syarikat-syarikat besar sekarang kerana Google dan Microsoft telah memberikan sumbangan yang menonjol untuk adegan sumber terbuka. ' Google juga merupakan penyumbang utama perisian sumber terbuka. Contoh utama ini termasuk Android , sistem operasi telefon pintar kami, Kromium , asas kod untuk penyemak imbas Chrome kami (sekarang juga menggerakkan banyak pesaing ), dan TensorFlow , sistem pembelajaran mesin kami. Pembebasan Google untuk Gabenor mengubah hosting awan selama-lamanya, dan telah membolehkan inovasi dan persaingan di seluruh industri awan. Google juga merupakan penyumbang kod sumber terbuka terbesar untuk GitHub , repositori bersama untuk pengembangan perisian. Pada tahun 2017, Googler membuat lebih daripada 250,000 perubahan kepada puluhan ribu projek di GitHub sahaja. '

Dalam kebanyakan kes, ini bukan kerana kemurahan hati tetapi lebih kepada manfaat daripada pembangunan percuma dan kemudian mendapat keuntungan dari penggunaan yang meluas. Walau apa pun, sumbangan ini telah membantu ribuan penyelidik dan mempelopori pengembangan perisian secara seragam, yang harus diraikan. Google dalam catatan blog baru-baru ini menyoroti sumbangan mereka untuk membuka data dan perisian sumber terbuka.



Dengan munculnya penjejakan masa nyata dan pengembangan kereta tanpa pemandu, banyak penyelidikan dilakukan dalam penglihatan komputer dan Google adalah salah satu syarikat di barisan hadapan Visual Tech.



Komitmen kami terhadap sumber terbuka dan data terbuka telah mendorong kami untuk berkongsi set data, perkhidmatan dan perisian dengan semua orang. Sebagai contoh, Google mengeluarkan Buka set data Imej daripada 36.5 juta gambar yang mengandungi hampir 20,000 kategori objek berlabel manusia. Dengan data ini, penyelidik penglihatan komputer dapat melatih sistem pengenalan imej. Begitu juga, berjuta-juta video beranotasi di YouTube-8M koleksi boleh digunakan untuk melatih pengecaman video.



- Perkara yang berbeza-beza

Ketua Ekonomi, Google

Google juga menggunakan banyak data yang dapat membantu penyelidikan NLP dan membantu komputer memahami pertuturan manusia dengan lebih baik. Dalam catatan blog, Google menyoroti perkongsian pangkalan data utama yang menyatakan ' Berkenaan dengan pemprosesan bahasa, kami telah berkongsi Soalan Semula jadi pangkalan data, yang mengandungi 307,373 soalan dan jawapan yang dihasilkan oleh manusia. Kami juga telah menyediakan Trillion Word Corpus , yang berdasarkan kata-kata yang digunakan di laman web umum, dan Pemapar Ngram , yang dapat digunakan untuk menjelajahi lebih dari 25 juta buku di Buku Google . Koleksi ini boleh digunakan untuk terjemahan mesin statistik , pengenalan suara, pembetulan ejaan , pengesanan entiti, pengekstrakan maklumat dan penyelidikan bahasa lain. '



Enjin carian adalah salah satu perniagaan utama Google, mendapat lebih dari 63,000 pertanyaan setiap saat. Data ini sangat penting bagi syarikat dan Google menganalisis data ini untuk iklan yang disasarkan. Namun, beberapa pandangan mengenai keseluruhan data disiarkan secara terbuka di portal tren Google.

' Google juga menawarkan Trend Google , perkhidmatan percuma yang membolehkan sesiapa sahaja melihat dan memuat turun aktiviti carian agregat sejak tahun 2004 untuk Carian Google, Carian Imej, Carian Berita, Belanja dan YouTube. Anda boleh mendapatkan maklumat carian untuk negara, wilayah, kawasan metro dan bandar secara bulanan, mingguan, harian dan bahkan setiap jam. Data Trends digunakan secara meluas oleh para penyelidik dalam bidang yang berbeza-beza seperti perubatan dan ekonomi. Menurut Google Scholar, ada lebih daripada 21,000 makalah penyelidikan yang menyebut Trends sebagai sumber data. '

Mengapa Mengusahakan Projek Sumber Terbuka?

Saya membincangkan perkara ini secara ringkas pada awal artikel. Perisian perisian baru dapat menerapkan idea hebat dan menginovasi ruang tetapi itu tidak menghalang orang lain daripada menerapkan idea serupa dan kemudian berusaha untuk menjadikannya lebih baik. Banyak syarikat telah mempelajarinya dengan cara yang sukar, misalnya Windows Phone. Seperti yang kita ketahui, itu adalah kegagalan yang luar biasa dan kerana banyak sebab tetapi mempunyai persekitaran yang tertutup dan mengendalikan perlesenan adalah sebahagian besarnya. Hardoop dan HDFS adalah versi MapReduce sumber terbuka yang dibina oleh Google dan syarikat itu mengetahui pentingnya sumber terbuka sejak awal. Secara ringkas, keputusan untuk membuat sumber terbuka IP adalah sesuatu yang strategik.

Google dalam catatan blognya meneliti beberapa sebab lain, dengan menyatakan ' Pertama dan terpenting, misi utama kami adalah 'menyusun maklumat dunia dan menjadikannya dapat diakses dan berguna secara universal.' Tentunya satu kaedah yang jelas untuk menjadikan maklumat dapat diakses dan berguna secara universal adalah dengan memberikannya ! '

Mereka juga membincangkan mengapa mereka tidak dapat melepaskan beberapa perkara yang menyatakan ' Sudah tentu, kami tidak dapat melepaskan semua data yang kami gunakan dalam perniagaan kami. Kita perlu melindungi privasi pengguna, menjaga kerahsiaan untuk pelanggan perniagaan, dan melindungi harta intelektual Google sendiri. Tetapi, dengan pertimbangan seperti itu, kita umumnya berusaha menjadikan data kita 'dapat diakses secara universal dan berguna' mungkin. '

Teg google