Делимся успехами, идеями и просто говорим за жизнь. С чего начать. ML 1) Coursera https://www.coursera.org/course/ml 2) EDX https://courses.edx.org/courses/CaltechX/CS_1156x/3T2014/info 3) Теоретическая база: Bishop - Pattern Recognition and Machine Learning 4) Практическая база: Programming Collective Intelligence NLP 1) https://class.coursera.org/nlangp-001 - тут начинают с hidden markov chains и context free grammars 2) http://thepiratebay.se/torrent/10694235/CourseraNaturalLanguage_Processing - другой курс от Стенфорда, здесь начинают регулярок и расстояния Левинштейна между словами. Еще есть интересные курсы: 1) https://class.coursera.org/pgm-003 - более подробно рассмотен байес и марковские процессы. 2) https://class.coursera.org/datasci-001 - технический обзор SQL\NOSQL, методов машинного обучения и т.д. Если вы не можете в английский или хотите поддержать отечественный хайтек, то можете смотреть видео яндекса (хотя у них нет ни одной публикации, так что доверяйте им на свой страх и риск): http://shad.yandex.ru/lectures/machine_learning.xml В техническом плане хорошо еще посмотреть на статьи и соревнования на kaggle. Например: http://www.kaggle.com/wiki/GettingStartedWithPythonForDataScience На каггле обитают адепты R (который неизвестно может ли в многопоточность и у которого примитивный дебагер) и Python. Питон очень медленный, так что годится только для написания прототипа. Многие предпочитают Java, Lua, Go, Julia.
- wakaba 3.0.9 + futaba + futallaby -