Apache Mahout
表示
開発元 | Apache Software Foundation |
---|---|
最新版 |
0.13.0
/ 2017年4月17日 |
リポジトリ | |
プログラミング 言語 | Java |
対応OS | Cross-platform |
サポート状況 | Active |
種別 | machine learning |
ライセンス | Apache 2.0 Licence |
公式サイト |
mahout |
Apache Mahoutは、Apache Software Foundationが管理する機械学習アルゴリズムのオープンソース・ソフトウェアである。Apache Mahoutは、協調フィルタリングやクラスタリング、クラス分類に特化されたスケーラブルなアルゴリズムを実装している。これらの実装の多くは、Apache Hadoopのプラットフォームが使用されている。[1][2]Mahoutでは、一般的な線形代数や統計などの数学操作のためのJavaライブラリやプリミティブ型を提供している。Mahoutは現在開発中であり、実装されたアルゴリズムの数は急速に増えている。しかし、アルゴリズムの種類は未だ満たされたものとは言えない。[3]
Mahoutのコアとなるクラスタリング、クラス分類のアルゴリズムは、Apache HadoopのMapReduceのパラダイム上に実装されているが、これによってHadoopを利用しないと実装が制限されるわけではない。したがって、単一ノード、もしくはHadoopクラスタ以外での実行も推奨されている。 例えば、Mahoutを使う上でメインディッシュとなる、協調フィルタリングによるレコメンダシステムコンポーネントは、Hadoopを使わない環境でも実行することができる。 Pregel(Google社で開発)ライクなGiraphなどの開発途上のプロジェクトとの統合も積極的に議論されている。
参考文献
[編集]- ^ “Introducing Apache Mahout”. ibm.com (2011年). 13 September 2011閲覧。
- ^ “InfoQ: Apache Mahout: Highly Scalable Machine Learning Algorithms”. infoq.com (2011年). 13 September 2011閲覧。
- ^ “Algorithms - Apache Mahout - Apache Software Foundation”. cwiki.apache.org (2011年). 13 September 2011閲覧。
外部リンク
[編集]- 公式ウェブサイト
- EC2 AMI with Hadoop and Mahout
- Giraph - a Graph processing infrastructure that runs on Hadoop (see Pregel).
- Pregel - Google's internal graph processing platform, released details in ACM paper.
- Mahout Mailing List Archives - Mahout Mailing List Archives