2020年1月版:AI/機械学習/データサイエンス関連ニュースまとめ

2020/02/05 11:30

 Microsoftの「R」コミュニティー向けブログサイト「Revolutions」が2020年1月31日(米国時間)、人工知能(AI)や機械学習(ML)、データサイエンスなどに関する2020年1月のニュースのまとめを掲載した。

オープンソースAI、ML、データサイエンスに関するニュース

AI/ML業界ニュース

  • Google Cloud Platform(GCP) ML用データの準備プロセスをスピードアップさせる「Auto Data Exploration and Feature Recommendation Tool」をリリース
  • Google パブリックデータセットの検索エンジン「Google Dataset Search」の一般提供を開始
  • NetflixとAmazon Web Services(AWS) Pythonベースの“人間中心の”データサイエンスフレームワーク「Metaflow」をオープンソースとしてリリース(関連記事
  • RStudioプロジェクト 新たに公益法人となった。同法人はデータサイエンスや科学研究、技術コミュニケーションに向けたフリーなオープンソースソフトウェアの開発を憲章に掲げている
  • Facebook 「VizSeq」をオープンソース化。VizSeqは、幅広いテキスト生成タスクのビジュアル解析を簡素化するPythonツールキット
  • AWS 新サービス「Open Data on AWS」をリリース。「Registry of Open Data on AWS」により、AWSサービスで公開されているデータを容易に見つけることができる

Microsoftニュース

  • 「AI for Health」 予算4000万ドルの5カ年プログラムとして開始。助成金の他、データサイエンス専門家や技術などのリソースを投入し、AIを利用して健康問題に取り組む
  • 「Visual Studio Code」 Python拡張であり、Notebookのカーネル選択やターミナルでの環境の自動アクティベーションなどの改良が加わった
  • 「Azure Machine Learning」サービス シングルルートI/O仮想化やInfiniBandを備えたVM(仮想マシン)をサポート。BERT(Bidirectional Encoder Representations from Transformers)のような大規模ディープラーニングモデルのトレーニングプロセスをスピードアップさせる狙い
  • 「Microsoft Video Indexer」 多言語音声の文字起こしと高精細キーフレームの抽出をサポート。後者はCustom Visionで使用される
  • 「Microsoft Translator API」 特定分野に固有の語彙(ごい)やイディオムを使用するカスタム翻訳をサポート
  • 「InterpretML」 オープンソースのPythonパッケージのα版がリリース。InterpretMLは、解釈可能なMLモデルをトレーニングし、ブラックボックスシステムを説明するための「Explainable Boosting Machine」を実装する
  • 「fairlearn 0.4.1」 AIシステムの公平性を評価し、観察された不公平さを軽減するためのPythonパッケージの最新版が公開

学習リソース

2020年1月版:AI/機械学習/データサイエンス関連ニュースまとめ