Архив Доброчана

[Burichan] [Futaba] [Gurochan] [Photon] [Tomorrow] - [Главная] [Управление]

Архив Доброчана — /u/

Ответ

Perceptron.png (0.0 KB, -1x-1)

Нейросети и машинное обучение Анонимус 23 марта 2016 (Ср) 18:20 No.150925

Почему на Добраче до сих пор не был кафедры машинного обучения? Недавно заинтересовался нейросетями, но наткнулся на проблему недостатка понятной и структурированной информации на русском языке на самом деле меня забаниили в гугле. Сейчас попробовал многослойные перцептроны в задачах аппроксимации и классификации, в принципе довольно успешно задачу четности решить не смог, немного попрактиковал расознавание картинок и наткнулся на сверточные сети, которые, по-моему, объясняются всюду из рук вон плохо.
Может быть анон подскажет, где искать чудесные источники информации, где по полочкам разложены топологии сетей, методы обучения, функции активации, приемы для обучения сетей и так далее. Кроме того, неплохо было бы найти задачки и датасеты на все эти моменты.
Еще хотелось бы узнать, что еще необходимо изучить для того, чтобы погрузиться в мир машинного обучения в математической части не очень силен, но численные методы оптимизации и основы статистики знаю.

В общем, нить машинного обучения и нейросетей иди!

Анонимус 24 марта 2016 (Чт) 21:49 No.150964

>>150925
Это очень сложно из-за сопутствующего матана. Нужно быть и кодером, и математиком сразу, что редкость и дорого ценится. Потому тред наврядле взлетит. Я кодер, но когда полез в НС, не понял даже основ, какая-то китайская грамота с безумным количеством формул. С матаном у меня полный ноль, потому понял, что пролетаю.
На английском инфы полно, однако надо очень хорошо знать всю математику профильного универа, иначе ничего там непонятно.

>>	Анонимус 24 марта 2016 (Чт) 22:37 No.150965 >>150925 Я хочу! С чего начать? Оп, но тебя уже наверняка не догоню.

Анонимус 25 марта 2016 (Пт) 00:02 No.150974

>>150964
У меня сложилось впечатление, что на практике для использования нейросетей знать матана особо не надо не надо. Ну серьезно, все библиотеки давно написаны если вы конечно не хотите вырываться во что-то гениальное и становиться чемпионами kaggle.com, и для простых сетей типа перцептронов, и для DeapLearning (сложных многослойных сетей). И вообще задача использования нейросетей, как я понял, похожа на задачу использования методов оптимизации, то есть подбора параметров (топологии сети, числа слоев, числа нейронов, функции активации, метода обучения и количества эпох обучения). Да и вообще, в самой идеи нейросети ничего сложного с точки зрения математики нет, только в методах обучения, но на практике, похоже, и не надо знать почему метод такой, а надо знать КАКОЙ метод использовать. Так что для меня то проблема состоит в отсутствии хороших практических пособий, а не бесполезных статей из формул. Опять же, формулы лишними не будут, я предпочитаю разбираться, как что работает, но это практической части бы побольше.
>>150965
Я начинал примерно так: прочитал, что такое нейросеть и для чего она нужна, нашел самую элементарную нейросеть (однослойный перцептрон), затем перешел к практике. Для начала решил написать сетевую библиотечку сам иначе не мог, это позволило мне лучше разобраться, для этого прочитал про искусственный нейрон и функции активации, затем, собственно, про сам перцептрон. Потом потрахался с обучением и запилил обучение методом обратного распространения ошибки. Проверил на работоспособность, подправил, и, о чудо, все заработало. Тогда я скачал популярную и простую библиотеку для питона и начал играться. Сначала аппроксимировал прямую хотя на это способен даже ОДИН нейрон, затем синусоиду и решил задачу XOR простейшая линейно неразделимая задача. Потом немного с классификацией, вроде положительные/отрицательные числа и задачу про Ирисы. Вот сейчас пытаюсь, когда нахожу время, изучать другие топологии и методы обучения, хотя на сверточных сетях слегка запоролся.
Элементарные советы могу дать такие: число входных нейронов равно числу стимулов (например для картинки 16х16 = 256, для функции одной переменной - 1 нейрон, для функции трех переменных - 3), если задача легко формализуема, то в скрытом слое надо немного нейронов (штук 5), если сложно - сильно больше. Эпох обучения нужно довльно много, 10 - 10000, и это может занять немало времени (так как метод обратного распространения ошибки это градиентный алгоритм), но не слишком много, иначе можно столкнуться с проблемой переобучения*.
Алсо, если нужно я могу как-нибудь объяснить персептрон и тому подобные вещи на пальцах.

P.S извините за неровный почерк

>>	Анонимус 25 марта 2016 (Пт) 10:34 No.150980 Оп говорит про структуру искусственного интеллекта?

>>	Анонимус 25 марта 2016 (Пт) 11:01 No.150983 >>150980 Нет, узко заточенные задачи классификации.

>>	Анонимус 25 марта 2016 (Пт) 12:54 No.150992 >>150974 Давай объясняй, и накидай чего хорошего почитать можно, пожалуйста.

>>	Анонимус 25 марта 2016 (Пт) 16:42 No.151002 >>150925 У меня стойкое дежавю, тут был точно такой же тред полгода назад, даже картинка та же.

>>	Анонимус 25 марта 2016 (Пт) 20:34 No.151010 >>151002 Насчет картинки не помню, но Кафедра Машинного Обучения точно была, причем долго висела на нулевой.

Анонимус 25 марта 2016 (Пт) 23:46 No.151013

>>150980
Про нейросети, которые в том числе могут использоваться в области искуственного интеллекта.

>>150992
Попробую, как найду время, пока нужно определиться с формой подачи информации вероятно в картинках или IPython тетрадках

>>151010
Значит я опростофилился, хотя возможно тред уже давно утонул и его не найти.

Алсо, завтра скину немного картинок с аппроксимацией простых функций, а также возможно графики "качества" аппроксимации в зависимости от числа нейронов и эпох обучения.

>>	Анонимус 26 марта 2016 (Сб) 11:54 No.151027 Вкатываюсь, быстро, решительно.

>>	Анонимус 26 марта 2016 (Сб) 12:17 No.151029 >>150925 Оп, а есть какие-то конструкторы нейросетей? Хочу поиграться с машинной интроспекцией.

Анонимус 26 марта 2016 (Сб) 18:36 No.151046

>>150974
Я хотел обучить deepdream на анимешные картинки, это был бы вин. Оборудование есть, пикч навалом. Но как глянул на инструкции, как это сделать - там вагон теории, формул, терминов... Ничего не понял, а изучать целый пласт очень сложных технологий, чтобы сделать десяток картинок, как-то не прельщает. Ну и еще я пишу софт, в котором классификатор картинок пришелся бы весьма кстати.

Анонимус 26 марта 2016 (Сб) 19:57 No.151049
line.png (0.0 KB, -1x-1)

Вот примерно так аппроксимируется линейная и квадратическая функции. На гауссиану и синусоиду, видимо, не хватило нейронов (так как довольно много точек в обучающей выборке было), они получились очень кривыми, переучивать не стал, и так по 20 минут обучение идет. Алсо, заценил алгоритм RProp+, он значительно быстрее обратного распространения ошибки, надо почитать про него.
Пока чего-то не нахожу времени для того, чтобы сесть и разобраться со сверточными нейросетями.

>>151029
Смотря что ты понимаешь под "конструкторами". Визуальных, типа редактора графа сети и свойств нейронов нет, или, , что более вероятно они не особо известны и я их не встречал А вообще гениальная идея, быть может если не найду когда-нибудь сам сделаю. С другой стороны это нужно только для небольших сетей произвольной топологии, в других случаях это скорее обуза. Но есть куча библиотек для разных языков программирования, я использую PyBrain. В нем можно быстро создать перцептрон или же вручную задать множество нейронов и множество связей между ними. Так же там есть инструменты для обучения сетей c учителем и без него, оптимизации функций и, в том числе, интерфейс для генетических алгоритмов.

>>	Анонимус 26 марта 2016 (Сб) 22:41 No.151052 >>151049 Какая конфигурация сети у твоих примеров?

>>	Анонимус 26 марта 2016 (Сб) 23:04 No.151053 Вот что я нашел, пока искал какую-нибудь простейшую статью для начала знакомства с нейросетями: https://software.intel.com/ru-ru/blogs/2011/12/22/finereader-2 Годная статья, даже код уже написан.

Анонимус 26 марта 2016 (Сб) 23:22 No.151054

>>151053
Проблема этой статьи в том, что используется сеть Хопфилда, достаточно сложная штука с рекуррентыми связями. Для меня самой первой и простой практической статьей была эта: https://habrahabr.ru/post/148407/
В PyBrain перцептрон создается одной командой, так же быстро создается датасет и можно приступать к обучению. Думаю приступить к сетям с рекуррентными связями после сверточных (из проще на практике применять).

Анонимус 27 марта 2016 (Вс) 11:40 No.151068

>>151027
Не знаю, надо, наверное, написать какие-то ближайшие свои планы, что я собираюсь почитать-разобрать.
1. Поверхностно пройтись по тутору: http://deeplearning.net/tutorial/
2. Туториал по Caffe (http://caffe.berkeleyvision.org/tutorial/ ?)

Хотеть понять, как сейчас модно писать сети с более-менее сложной архитектурой, как выкачивать и напрямую использовать/модифицировать уже обученные на всяких imagenet'ах сети и как и на чём писать LTSM-сетку.

Планы на неделю, наверное.

>>	Анонимус 27 марта 2016 (Вс) 16:33 No.151081 >>151068 Глянул сайт по первому пункту и обнаружил там прекрасный гайд по сверточным сетям. Да и вообще на первый взгляд выглядит как лютый вин, надо тоже ознакомиться, а в идеале понять и попробовать на практике это все.

>>	Анонимус 27 марта 2016 (Вс) 20:09 No.151091 >>151054 А мне статья как раз и показалась интересной потому что в ней всё подробно сделано. Мне кажется, проще понять когда знаешь как всё работает.

Анонимус 28 марта 2016 (Пн) 13:45 No.151108

Я что-то более-менее понимаю в математике и с простейшими ИНС уже ознакомился. Где можно почитать краткое описания большинства видом ИНС? Чтобы без лишней воды, по пунктам была описана функция, пороговая функция, правило обучения, ну... тоесть все необходимое, без рассуждений и доказательств.

Анонимус 28 марта 2016 (Пн) 23:16 No.151123

>>151108
Вот и я того же ищу, только вместо

> пороговая функция
Интереснее бы узнать применение этой сети, так как функция активации не играет особой роли за некоторыми исключениями. Главное, чтобы была плавной, дифференцируемой и сворачивала входное значение в отрезок [-1;1]

Анонимус 28 марта 2016 (Пн) 23:30 No.151124

>>151052
Элементарный перцептрон с 1 выходом, 1 входом и 1 скрытым слоем. Что еще нужно для аппроксимации функции переменной? Кстати, универсальная теорема аппроксиматоров говорит, что сеть с одним скрытым слоем может аппроксимировать любую непрерывную функцию.

Анонимус 29 марта 2016 (Вт) 13:02 No.151138

Кстати, все эти темы с аппроксимацией вызвали у меня вопрос: способны ли нейросети к экстраполированию функций. Если посмотреть на структуру сети с полносвязными слоями и представить как она работает в голову приходит ответ "не способны" или "малоспособны". Быть может я неправ или же есть какие-то хитрые архитектуры, которые могут это делать?

>>	Анонимус 29 марта 2016 (Вт) 19:12 No.151154 >>150925 Как и обещал, запилил гайд по перцептрону. Как и все у меня, гайд получился кривоват, так что буду очень рад всем исправлениям и советам. с: знаком создайте намекает, что этого будет недостаточно%

>>	Анонимус 29 марта 2016 (Вт) 19:15 No.151155 Перцептрон.zip (0.0 KB, -1x-1) >>151154 Плюсом ко всему запорол разметку и забыл сами файлы. Зато новая капча весьма благосклонна ко мне.

Анонимус 29 марта 2016 (Вт) 20:32 No.151159

>>151155
В общем-то достаточно годно. Вчера я сделал простую реализацию перцептрона на основе того, что прочитал про него в википедии, но там используется пороговая функция и веса связей дискретные.
Тут был один вопрос, но он уже отпал.
Мне кажется, в абзаце про обучение лучше всё же добавить математики, а то так это просто общие слова, после которых надо лезть в википедию и читать всё ту же математику.
ПС:На картинке на второй странице ты хотел написать xnWn, а не x3W3.

>>	Анонимус 29 марта 2016 (Вт) 20:36 No.151160 >>151159 А, ещё вопрос: в сети которую ты описывал, как я понял, каждый нейрон в любом случае что-то передается, у них нет порога активации, как у настоящих нейронов. Чем это лучше?

Анонимус 29 марта 2016 (Вт) 21:00 No.151165

>>151155

> Это градиентный (использующий производные) алгоритм оптимизации.
Ладно, про итерации рассчета и сползание к минимальное ошибке я понял. Но что такое производные и зачем они нужны? Что с их помощью можно сделать такого, что нельзя реализовать обычными уравнениями вида 2=x+1 ?

hashtag why am i so dumb and annoying

>>	Анонимус 29 марта 2016 (Вт) 21:34 No.151168 >>151049 Расскажи поподробнее, что делает твоя программа? Что значит "аппроксимируется линейная и квадратическая функции"?

>>	Анонимус 29 марта 2016 (Вт) 21:37 No.151169 >>151168 Его сеть научилась распознавать y=x и y=pow(x,2). Правда теперь я не понимаю на какой из входов нужно подавать функция для распознавания. Несу чушь.

>>	Анонимус 29 марта 2016 (Вт) 22:31 No.151174 >>151169 > научилась распознавать y=x и y=pow(x,2) Это звучит очень расплывчато и может многое означать. Что конкретно делается? Например, что подаётся на вход и что подаётся на выход? (только не надо говорить "функция", в каком виде?)

>>	Анонимус 29 марта 2016 (Вт) 22:42 No.151175 >>151174 > подаётся на выход Ничего же. Там забирают результат. > вход Я ничего не понял, пусть Оп придет.

Анонимус 29 марта 2016 (Вт) 22:58 No.151178

>>151174
Насколько я понял, суть в том, что нейронная сеть тебе заменяет саму функцию, то есть ты ей даёшь значение переменной(-ых), а она тебе значение функции в данной точке с определённой точностью. Обучение заключается в том, что ты даёшь ей конечный набор точек и значений функции в соответствующих точках. То есть конечный смысл таких сетей в том чтобы "строить" функции зная только некоторые значения.

>>	Анонимус 29 марта 2016 (Вт) 23:12 No.151180 >>151178 Тогда в его примерах со скринами линии и параболы у сети один вход и один выход? Сеть с двумя входами сможет имитировать f(x1,x2) и т.д. ? Я все еще хочу узнать зачем тут производные. Наглядно, на пальцах, без смс.

>>	Анонимус 29 марта 2016 (Вт) 23:18 No.151182 >>150925 Лииииииииииииииииииииииииииииииииисп!

Анонимус 29 марта 2016 (Вт) 23:25 No.151183

>>151159

> лучше добавить математики
Вероятно, однако я считаю, что этого особо и не надо знать для того, чтобы работать с нейросетями, методы оптимизации имеют весьма косвенное отношение к ним, а все библиотеки уже содержат в себе эти методы.
Алсо, перечитал гайд, да, есть несколько ошибок, и, возможно, что-то таки стоит добавить.

>>151160
Во-первых, такая функция активации не дифференцируема и, соостветственно, нейросеть не будет обучаться большинством методов. Во-вторых, резкий переход это наоборот хуже, а тут, как бы это сказать, более широкий спектр возможностей. Тем более подбирая параметры сигмоиды можно приблизить ее к пороговой функции (но не нужно, ибо это сильно усложнит обучаемость сети). Вообще функции активации это отдельная непростая тема, но, насколько я понял в большинстве случаев лучше брать сигмоиду.

>>151168
Мы как бы "учим" сеть выполнять какую-то функцию (например возведение в квадрат), показывая ей примеры.
То есть на этапе обучения мы даем ей (вереее не нейросети, а алгоритму обучения) на вход точки xi и заявляем, что правильный выход должен быть yi.
Затем, после обучения мы подаем ей на вход какие-то xj, а сеть пытается выполнять роль той функции, которая должна перевести xj в искомое нами yj.
Например, условно говоря, на этапе обучения мы даем датасет [1, 2, 3, 4, 5] и значения, которые должны получиться [1, 4, 9, 16, 25]. Затем мы активируем сеть с входным значением 1,5 и на выходе получим 2.2527.

>>151169
Сеть научилась не распознавать функцию, а "выполнять роль этой функции" с определенной точностью, хотя обучить сеть оаспознавать функцию тоже вполне реально и не особо сложно (задача классификации). Надо бы кстати попробовать. Так как это функция одной переменной у нас в входном и выходном слоях по одному нейрону, значение, естественно, подается на входной.

>>	Анонимус 29 марта 2016 (Вт) 23:25 No.151184 >>151182 Лэйн?

>>	Анонимус 29 марта 2016 (Вт) 23:28 No.151185 >>151178 This.

>>	Анонимус 29 марта 2016 (Вт) 23:32 No.151186 >>151183 Всё понял, спасибки.

Анонимус 29 марта 2016 (Вт) 23:47 No.151190

>>151178
Алсо, все таки не

> таких сетей
А такого использования сети. Применений к сети такой же конфигурации уйма (то же распознавание изображений, классификация).

Кстати, получилось довольно неплохо аппроксимировать функцию Гаусса и синусоиду, когда-нибудь думаю скинуть heatmap качества работы в зависимости от количества нейронов и эпох обучения. Он заодно неплохо отражает переобучение.

>>	Анонимус 30 марта 2016 (Ср) 00:00 No.151191 >>151190 Прости, что ты понимаешь под хитмапом? Это ведь визуализация в трех переменных - декартовые икс, игрек и отдельный зет как цвет горячести? Если одно полное обучение у тебя выпекается по 20 минут, дождемся мы этого ещ е не скоро.

Анонимус 30 марта 2016 (Ср) 17:02 No.151204

>>151191
Угу, тот самый heatmap. Но одно обучение занимает куда меньше времени, я обучал сеть с параметрами [1, 3, 7, 10, 35] нейронов и [0, 1, 5, 15, 50, 100, 1000] эпох обучения, и это занимало 20-30 минут хотя, например, когда обучал распознавать картинку 32х32 как раз столько и занимало обучение одной сети. Тут же дискретизация этих параметров может быть побольше, да и пределы тоже, но прирост числа эпох обучения не сильно усложняет задачу (я просто "доучиваю" сеть после активации), и только для изменения числа нейронов в скрытом слое приходится пересоздавать сеть. Алсо, мне же не обязательно сидеть за компьютером пока сеть обучается, я и на ночь могу оставить.
Другой вопрос в том, что синусоида, например, откровенно хреново аппроксимируется сетью с одним скрытым слоем (или же требует большого числа нейронов).

Анонимус 30 марта 2016 (Ср) 17:09 No.151205

Кстати, только что пришла в голову простая интересная идея - чтение капчи Доброчана с помощью нейросети. Надо только узнать, какой используется шрифт, если ширина букв одинаковая, то это очень несложно должно быть. На днях попробую сделать перцептроном, потом в сверточную сеть переведу. Если получится, то отпишу тут.

>>	Анонимус 30 марта 2016 (Ср) 19:24 No.151206 >>151205 Эту капчу можно сравнивать даже попиксельно. Оп, мы все очень хотим узнать о применениях сетей. Сделай это научно-популярно, все же первый раз.

>>	Анонимус 30 марта 2016 (Ср) 20:26 No.151208 >>151205 Мне кажется, капча доброчана этот тот случай когда проще написать алгоритм, чем использовать нейросеть. Другое дело капчи с искаженными буквами и всякими каракулями

Анонимус 30 марта 2016 (Ср) 21:02 No.151209

>>151208
Если шрифт моноширотный, я просто напишу алгоритм, который делит капчу на ячейки с буквами, а буквы уже буду распознавать нейросетью, это вроде бы не особо проблема. А вот распознавание их БЕЗ нейросети это уже сложнее, нужно искать, выбирать метод, реализовывать, а тут обучил сеть на шрифт и все.

>>	Анонимус 30 марта 2016 (Ср) 21:30 No.151211 >>151205 Ты мне нравишься. Давай дружить?

>>	Анонимус 30 марта 2016 (Ср) 22:21 No.151214 tumblr_lvhuuq55N71qhoyau.jpg (0.0 KB, -1x-1) >>151211 Зависть.

Анонимус 31 марта 2016 (Чт) 08:33 No.151220

>>151209

> Если шрифт моноширинный
Ньет, шире, как минимум, "ы", "щ", и, насколько могу судить - прочие "ж", "д", "ю".
Зато кернинг стабильный и ровный, можно спокойно буквы разделять, просто воспринимая их как одну цельную область в случае "Ы", "Й" и прочих уродцев - как две.
Ошизеть, сколько запятых получилось. Тут вот ещё две выбыли из строя и теперь не могут найти места в окопе: ,,

>>	Анонимус 31 марта 2016 (Чт) 13:19 No.151223 >>151209 > я просто напишу алгоритм С этих слов начинается любой проект, который обречён на долгую реализацию

>>	Анонимус 31 марта 2016 (Чт) 13:36 No.151225 >>151223 Даже если шрифт не моноширотный, но буквы разделены это 40 строк кода. Проблема будет только с буквой 'ы'.

>>	Анонимус 31 марта 2016 (Чт) 13:47 No.151228 1-34.png (0.0 KB, -1x-1) >>151220 C кернингом не так все просто, как казалось. Например на первой капче он отсутствует в паре букв "ду", на второй - в "ут". А вот разделять буквы без кернинга уже не так просто.

>>	Анонимус 31 марта 2016 (Чт) 15:20 No.151230 >>151228 Есть костыльный вариант: перебрать все эти сочетания и воспринимать их как отдельную букву. Величие конструкторской мысли.tiff

>>	Анонимус 31 марта 2016 (Чт) 15:42 No.151231 >>151230 Не вариант, это потребует невероятного времени обучения. Можно уж придумать эврестический алгоритм, который делит буквы с нулевым кернингом, да и то муторно.

>>	Анонимус 31 марта 2016 (Чт) 17:48 No.151233 Когда-нибудь я достигну достаточного уровня знаний, чтобы создавать машины на stm32 с НС. Воистину, тогда Омниссия будет доволен!

Анонимус 31 марта 2016 (Чт) 21:31 No.151241

Запилил скрипт, который делит капчу на буквы Ясно дело на проблему с "Ы" дело не тратил, не говоря уже про буквы без промежутка, с которыми очень не просто бороться. Осталось самое трудное - подготовка датасета и нормирование букв. Какой шрифт я так и не понял, но весьма похоже на Arial, однако им таки не является Если честно, это не особо критично должно быть, любой похожий шрифт подойдет для обучения. Кстати, обучать, похоже, придется ну очень долго, даже если я соберу таки все буквы.

>>	Анонимус 03 апреля 2016 (Вс) 02:59 No.151307 >>151228 Но "ду" не соединены. С "ут" согласен. Ещё "ух" и "гу".

>>	Анонимус 03 апреля 2016 (Вс) 23:52 No.151338 >>150925 А никто ещё не запилил датасет с самими каптчами/буквами из каптчи? А то обсуждаете-обсуждаете, кодить-то под что?

Анонимус 04 апреля 2016 (Пн) 01:42 No.151340

>>151241

> Ясно дело на проблему с "Ы" дело не тратил
Так может быть и не надо на неё тратить время?
В датасете, на котором будешь обучаться возьми и раздели Ы на ь и палку.
А потом при сборке ответа смотри — если распознали "палку" и перед ней был ь, то объединить в ы.

>>	Анонимус 04 апреля 2016 (Пн) 11:54 No.151348 >>151340 Хорошая идея, просто ь + \| потом читать как ы. >>151338 Я бы запилил, у меня уже давно готов скрипт, который делит на буквы капчу. Но сейчас навалилась куча дел по учебе, так что я отложил это дело как минимум до среды.

>>	Анонимус 05 апреля 2016 (Вт) 09:54 No.151381 Сап, очень стала интересна эта тема, но я знаю только паскаль. Есть примеры кода на нем?

Анонимус 05 апреля 2016 (Вт) 18:58 No.151403

>>151381
Они используют уже готовые библиотеки и не считают ничего руками. Буквально задают параметры связей в сети и запускают алгоритм обучения на ней yoba calculate(my neural_network) в пару строчек. Может пришла пора подучить другой язык, паскаль же слегка мертв?

>>	Анонимус 05 апреля 2016 (Вт) 18:59 No.151404 >>151403 > сломал корявый парсер

Анонимус 05 апреля 2016 (Вт) 20:53 No.151409

>>151381
Этот анон верно говорит
>>151403
все используют готовые библиотеки. С другой стороны, под Pascal/Delphi наверняка есть нейросетевые библиотеки а элементарную можно и самому написать, но выучить основы того же Питона можно быстрее, чем искать библиотеку под Паскаль и ебаться с ней.

>>	Анонимус 08 апреля 2016 (Пт) 11:52 No.151474 >>150925 А никто не умеет/не применяет реккуректные сети?

>>	Анонимус 08 апреля 2016 (Пт) 12:05 No.151475 >>151474 Что это такое? Как работает?

Анонимус 08 апреля 2016 (Пт) 17:53 No.151486

>>151475
Это такие нейронные сети, у которых выход связан со входом. Сейчас ими чуть ли не в носу ковыряются. И тексты понимать и тексты генерировать, и т.д. и т.п.

Видимо, мне нужно какое-то поверхностное представление об этом получить до воскресенья. Попробую отписаться, если получится.

Анонимус 08 апреля 2016 (Пт) 20:12 No.151492

>>151486

> Рекуррентная формула — формула вида
`

an = f(n, a{n-1}, a{n-2}, ..., a{n-p} ) ,

`

> выражающая каждый член последовательности a_n через p предыдущих членов. - wiki
Сложность вычисления следующего члена возрастает? Спасибо, заберите обратно.

>>	Анонимус 09 апреля 2016 (Сб) 00:10 No.151496 >>151492 Что я только что прочитал? >>151486-кун.

Анонимус 09 апреля 2016 (Сб) 12:57 No.151503

>>151496

> сети, у которых выход связан со входом
У всех сетей выход очевидно связан со входом.

Ты написал рекуррентные сети , я зашёл в энциклопедию и прочитал определение. Следующая итерация выражается через значения предыдущих. Итого сложность вычисления будет возрастать в O(n) ? Это хороший математический трюк, но считать такое тяжело.

>>	Анонимус 09 апреля 2016 (Сб) 21:54 No.151518 >>151492

>>	Анонимус 09 апреля 2016 (Сб) 22:56 No.151523 >>151503 Ты странный. Зачем идти в википедию искать похожий по звучанию термин, если там есть конкретно статья про реккурентные сети? enwiki://Recurrentneuralnetwork

>>	Анонимус 10 апреля 2016 (Вс) 14:46 No.151530 >>151503 > У всех сетей выход очевидно связан со входом. Зануда. Рекурентная сеть — орграф с циклами.

Анонимус 10 апреля 2016 (Вс) 21:14 No.151539

Про рекуррентные сети и LSTM:

http://karpathy.github.io/2015/05/21/rnn-effectiveness/
http://colah.github.io/posts/2015-08-Understanding-LSTMs/

TL;DR:
В общем, зачем нужны RNN — чтобы решать задачи вида
научиться отображать последовательность X t - > Y*t. (при этом порядок следования для нас важен в отличии от обычной задачи классификации)
Или последовательность X_t -> Y

Или научиться генерировать последовательность.
Или строить какое-то представление последовательности.

Или генерировать репчик (да, есть и такая статья).

Очень любят сейчас люди эти штуки пихать для работы с текстом.

Обучается — SGD по "развёрнутой" по времени сети. То есть у нас получается что-то вроде 4*T слоёв. Грустно и, видимо, обучается очень долго.

>>	Анонимус 24 апреля 2016 (Вс) 19:17 No.151849 help.pdf (0.0 KB, -1x-1) У меня есть пара теоретических вопросов, вроде приведенного. Был бы очень признателен, если бы кто-то объяснил как это показать и доказать.

>>	Анонимус 24 апреля 2016 (Вс) 21:42 No.151851 >>151849 Что-то не очень понял. В самом низу либо не нужна крышка над тетой, тогда вторая формула получается из подстановки в первую, либо, если крышка нужна, непонятно зачем эта строка нужна.

>>	Анонимус 25 апреля 2016 (Пн) 00:33 No.151853 help2.pdf (0.0 KB, -1x-1) >>151851 C сподстановкой я бы справился. Вроде как из последней строки можно вывести просто параметр тета0. Насколько я понял из других условий, тета с... крышкой, это среднеквадратическая ошибка. Вот все задачи.

Анонимус 25 апреля 2016 (Пн) 12:28 No.151854

>>151849
Не уверен, что понял, что от тебя хотят в этой задаче. Возьми в верхней функции производную по \theta 0 и приравняй её нулю. Отсюда выведешь условие на \theta 0. (оно точно совпадёт с тем, что написано в последней строке).

Подставив это самое \theta_0 в первую функцию, получишь в точности вторую функцию.

>>	Анонимус 25 апреля 2016 (Пн) 17:33 No.151856 >>151854 Ок, спасибо. А что скажешь по остальным задачам >>151853 ?

Анонимус 26 апреля 2016 (Вт) 09:31 No.151868

>>151856
А ничё непонятно.
Вот смотрю я вторую задачу. Что там за \theta i с крышкой? Это те же \theta i с крышкой, которые были в твоём прошлом листе? Почему из них вычитается именно \theta, а не \theta_i?

Или это просто набор из n оценок параметра \theta?
В таком случае, если не оговорено, что все эти \theta_i как минимум независимы, утверждение про дисперсию среднего просто неверно.

>>	Анонимус 26 апреля 2016 (Вт) 16:24 No.151876 >>151868 Кажется, я начал понимать кое-то. "Крышка" означает что это предсказанное значение. Дальше пока мысль особо не идет.

Анонимус 28 апреля 2016 (Чт) 13:11 No.151889

>>151876
Ты чем-то не тем занимаешься.

Вместо того, чтобы понять из контекста (ну, эти упражнения не на ровном же месте у тебя взялись - это приложение к какой-то лекции/курсу/учебнику/статье/туториалу/whatever), что же обозначают обозначения, в чём смысл задачи и эту задачу РЕШИТЬ, ты прикладываешь училия к тому, чтобы смысл обозначений УГАДАТЬ.

И очень этому угадыванию радуешься.

Хрень какая-то. Завтра ты откроешь другой очебник и там будут другие обозначения. И что ты будешь делать с двумя часами, потраченными на угадывание?
офкорс, я лукавлю, обозначать набор параметров тетой и использовать крышку/звёздочку/волну над буквой как обозначение 'оценка параметра' - штука довольно общепринятая, но не суть

>>	Анонимус 28 апреля 2016 (Чт) 15:16 No.151895 >>151889 Скажем так, контекста нет и я был бы рад хорошему учебнику по теме.

Анонимус 28 апреля 2016 (Чт) 15:26 No.151896

Какая сеть лучше всего подходит для китайской комнаты? Тоесть, не китайской, а какой-то латинской, не на распознавание картинок, а для работы с цифровым текстом - смысл слова не известен, но надо распознать что это именно слово по обучающей выборке образцов и классифицировать слово, хотя бы с двумя выходами.

Анонимус 28 апреля 2016 (Чт) 16:27 No.151900

>>151895

> по теме.
по какой теме?
Теорвер?
Матстат?
Машинное обучение?

С какой перспективы и с какой глубиной?

> Скажем так, контекста нет
Окей, откуда тогда эти задачи?
Нет, серьёзно, мне откровенно интересно, при каких таких условиях у листка с задачами не будет существовать контекста.

Разумеется, я могу это представить пару-тройку таких ситуаций. Одна интереснее другой.

Ты взял листок, взял в руку ручку, закрыл глаза, вошёл в гипнотический транс, а когда очнулся, весь листок был исписан задачами.

Ты обнаружил в почтовом ящике конверт с листом с этим задачами. Ни отпечатков, ни комментариев, ни ссылок. Только листок.

...
Нет, определённо, за этим может стоять только какая-то интересная и невероятная история! Пожалуйста, поведай мне её, я жажду её услышать!

>>151896

> Какая сеть лучше всего подходит для китайской комнаты?
Формализуй задачу.

> Тоесть, не китайской, а какой-то латинской
Всё ещё непонятно.

> не на распознавание картинок,
А в ~~бесполезном~~ мысленном эксперименте Серла было про распознавание картинок? Вау, каждый день узнаю что-то новое!

> а для работы с цифровым текстом
Работа с цифровым текстом обычно называется Natural Language Processing (NLP). Подзадача - видимо не видимо, методов - туевы кучи, статей видимо не видимо.

> смысл слова не известен, но надо распознать что это именно слово по обучающей выборке образцов и классифицировать слово, хотя бы с двумя выходами.
Что ты хочешь классифицировать, на какие классы и на чём планируешь обучать?
На входе последовательности символов, на выходе - вердикт была ли эта последовательность словом или просто случайным набором букв?
На входе слова - на выходе, было ли это слово глаголом или нет?

Для какой задачи тебе это нужно?

Конкретизируй.

Почему ты хочешь начать именно что с нейронных сетей (причём каких-то хитрых), а не попробовать для начала более простые, понятные и проверенные временем модели?

Анонимус 28 апреля 2016 (Чт) 16:39 No.151901

>>150925
Не нашёл другого поста про машинное обучение кроме этого, поэтому вкатываюсь сюда. Кто-нибудь упарывается контестами в kaggle? Есть ли какой-то смысл попытаться попасть в 25% / 10% в каком-нибудь контесте?

Натыкался случайно на людей в linkedIn'е, которые указывали, мол, "Был в top 10% в таком-то соревновании", но не уверен, относились ли соревнования к той эпохе, когда там еле-еле набиралось 200 человек, или к той, когда, как сейчас, 6000 тысяч участников, половина из которых отправила baseline'с форума и не может / не хочет продвинуться дальше.

>>	Анонимус 28 апреля 2016 (Чт) 17:15 No.151902 >>151900 Оставь почту, пожалуйста. Я стесняюсь тут >.<

>>	Анонимус 28 апреля 2016 (Чт) 17:51 No.151903 >>151902 Меня устраивает формат анонимного форума.

>>	Анонимус 01 мая 2016 (Вс) 14:20 No.151932 0049.png (0.0 KB, -1x-1) Недавно пилил на эту тему видео в рамках производственной практики

>>	Анонимус 02 мая 2016 (Пн) 12:11 No.151945 >>151932 Видео в тред, собственно

>>	Анонимус 03 мая 2016 (Вт) 10:06 No.151960 du_k_l_swamy_m_n_s_neural_networks_and_statisti(1).pdf (0.0 KB, -1x-1) >>150925 Какая-то могучая книжка по (неглубоким) сетям.

Анонимус 04 мая 2016 (Ср) 09:01 No.151971

>>151901
Может года два назад у всех была мания при найме смотреть на профили в kaggle, вроде успокоились.
Разница в точности моделей между 25% и 10% составляет меньше десятой процента, у топов же всё и то меньше. Сейчас это скорее такой показатель, что ты что-то вообще по теме делал.

>>	Анонимус 04 мая 2016 (Ср) 12:55 No.151973 >>150925 http://kldavenport.com/a-wild-dataset-has-appeared-now-what/ iPython notebook со всяким explanotory анализом, что нужно сделать с датасетом, когда впервые его видишь

Удалить сообщение [только файл]
Пароль

Имя
E-mail
Тема
Сообщение
Файл
Подтверждение
Пароль	(для удаления файлов и сообщений)
Supported file types are: GIF, JPG, PNG Maximum file size allowed is 1000 KB. Images greater than 200x200 pixels will be thumbnailed.