Googleが最近のブログ投稿でオープンソースとオープンデータの重要性について語る

技術 / Googleが最近のブログ投稿でオープンソースとオープンデータの重要性について語る 読んだ3分

グーグル



企業としてのGoogleは、少なくとも彼らの立場では、常にオープンソースのソフトウェアとデータをサポートしてきました。グーグルとマイクロソフトの両方がオープンソースシーンに顕著な貢献をしたので、それは今や大企業のほとんどの傾向です。 「「 Googleはオープンソースソフトウェアへの主要な貢献者でもあります。これの主な例は次のとおりです アンドロイド 、スマートフォンのオペレーティングシステム、 クロム 、Chromeブラウザのコードベース(現在は 多くの競合他社に電力を供給する )、および TensorFlow 、私たちの機械学習システム。 Googleのリリース 知事 クラウドホスティングを永遠に変え、クラウド業界全体でイノベーションと競争を可能にしました。 Googleはオープンソースコードの最大の貢献者でもあります GitHub 、ソフトウェア開発用の共有リポジトリ。 2017年、Google社員はGitHubだけで数万のプロジェクトに250,000を超える変更を加えました。 「」

ほとんどの場合、それは本当に寛大さからではなく、自由な開発から利益を得て、それから広く採用されることから利益を得ることについてです。とにかく、これらの貢献は何千人もの研究者を助け、ソフトウェア開発を一律に主導してきました。これは称賛されるべきです。 Googleは最近のブログ投稿で、オープンデータとオープンソースソフトウェアへの貢献を強調しています。



リアルタイム追跡の出現と自動運転車の開発により、コンピュータービジョンで多くの研究が行われており、Googleはビジュアルテックの最前線にいる企業の1つです。



オープンソースとオープンデータへの取り組みにより、データセット、サービス、ソフトウェアをすべての人と共有するようになりました。たとえば、Googleは 画像データセットを開く 人間がラベル付けしたオブジェクトの約20,000のカテゴリを含む3,650万の画像のうち。このデータを使用して、コンピュータビジョンの研究者は画像認識システムをトレーニングできます。同様に、の何百万もの注釈付きビデオ YouTube-8M コレクションは、ビデオ認識のトレーニングに使用できます。



-異形

Googleチーフエコノミスト

Googleはまた、NLPの調査に役立ち、コンピューターが人間の発話をよりよく理解するのに役立つ多くのデータを利用しています。ブログ投稿で、Googleは次のように述べている主要なデータベースの共有を強調しました。 言語処理に関しては、 自然な質問 307,373人が作成した質問と回答を含むデータベース。また、 兆ワードコーパス 、公開Webページで使用されている単語に基づいており、 Ngramビューア 、2500万冊以上の本を探索するために使用できます Googleブックス 。これらのコレクションは、 統計的機械翻訳 、 音声認識、 スペル修正 、エンティティの検出、情報抽出、その他の言語調査。」



検索エンジンはGoogleの中核事業の1つであり、毎秒63,000を超えるクエリを取得しています。このデータは会社にとって非常に重要であり、Googleはターゲット広告のためにこのデータを分析します。それでも、全体的なデータに関するいくつかの洞察は、Googleのトレンドポータルで公開されています。

「」 Googleはまた提供します Googleトレンド 、Google検索、画像検索、ニュース検索、ショッピング、YouTubeの2004年以降の集計検索アクティビティを誰でも表示およびダウンロードできる無料サービス。国、地域、大都市圏、都市の検索情報を、月次、週次、日次、さらには1時間ごとに取得できます。トレンドデータは、医学や経済学などさまざまな分野の研究者によって広く使用されています。 Google Scholarによると、 21,000以上の研究論文 トレンドをデータソースとして引用しています。」

なぜオープンソースプロジェクトに取り組むのですか?

これについては、記事の冒頭で簡単に説明しました。新しいソフトウェアは素晴らしいアイデアを実装してスペースを革新することができますが、それでも他の人が同様のアイデアを実装してそれを改善するために取り組むことを妨げるものではありません。多くの企業は、たとえばWindowsPhoneなどの難しい方法でそれを学びました。私たちが知っているように、それは重大な失敗であり、多くの理由がありましたが、閉じた環境を持ち、ライセンスを管理することはそれの大きな部分でした。 HardoopとHDFSはGoogleによって構築されたMapReduceのオープンソースバージョンであり、同社は早い段階でオープンソースの重要性を学びました。要約すると、IPをオープンソースにするという決定は戦略的なものです。

グーグルはそのブログ投稿で、他のいくつかの理由を掘り下げて、次のように述べています。 何よりもまず、私たちの主な使命は、「世界の情報を整理し、世界中の人々がアクセスできて使えるようにすること」です。確かに、情報を普遍的にアクセス可能で有用なものにするための1つの明白な方法は、情報を提供することです。 ! '

彼らはまた、なぜ彼らがいくつかのものをリリースできないのかについて話します。 もちろん、ビジネスで使用するすべてのデータを公開することはできません。ユーザーのプライバシーを保護し、ビジネス顧客の機密性を維持し、Google自身の知的財産を保護する必要があります。しかし、そのような考慮事項を条件として、私たちは通常、データを可能な限り「普遍的にアクセス可能で有用」にするように努めています。 「」

タグ グーグル