Много перепробовал пакетов вернулся к neurosolution. Весь вопрос в настройке сети, алгоритмов и методов обучения. Исследовал только продолжительность жизни на очень маленькой базе - 150. Если кому интересны настройки сети - персептрон с 1 скрытым слоем, таксон, алгоритм левенберга-марквардта, генетический метод обучения. Пока такая сеть лучшие и устойчивые результаты дает. Планирую базу увеличить до 1000 хотя бы.
Кстати Марс в безусловных лидерах при такой конфигурации сети.
Если у кого-нибудь есть 7 версия этого пакета с аспирином, поделитесь. Хорошая программа но не из дешевых
Планеты септенера, уран, нептун, плутон, asc, mc, куспид 8, в.узел.
Долгота. Синус-косинус вместо долготы в этом пакете вроде бы не особо влияет на результат. Но если я правильно понимаю - чем больше переменных, тем больше нужно данных для корректной работы.
Пол не учитывал.
в какой СД и почему именно сам куспид? С его включением/выключением что-то меняется?
Каковы текущие результаты?
Только что обучил сеть без куспида. Результаты тестовой выборки:
mean absolute error 12.8
minimum absolute error 0.8
max absolute error 36.4
График впечатляет тем что четко показаны минимумы. Хотя в данных таких примеров мало - и в тестах, и в перекрестной и в обучающей проверке. Но сеть четко показывает 5 из 6 минимумов в тестовых данных(38). Это не может быть случайностью никак
С ума сойти. Ставлю марс единственным входом - результат почти такой же. Ставлю сатурн единственным входом(он ни в каких конфигурациях сетей значимым не был, вопреки моим ожиданиям) - результат нулевой.
То есть, сеть каким-то образом обучается прогнозировать продолжительность жизни только по долготе марса.
Буду экспериментировать теперь с добавлением входов к марсу по одному.
Перемешал все данные, устранил 2 ошибки. Марс делаю единственным входом, обучаю - все равно устойчивый результат. Не понимаю как это работает.
У меня теория - марс укорачивает среднюю продолжительность жизни. Поэтому нейросеть его и выделяет в наборе данных со средней продолжительностью жизни 70 лет. Легче всего увидеть отклонение от нормы.
По-моему, дальше имеет смысл копать только при увеличении количества данных. Это только в книгах Ясницкого сеть можно обучить на 20 данных. Я уже успел понять что это из жанра фантастики.
Добавление данных(250) улучшения результатов не дает. Добавление новых входов пока тоже. Neural tools определяет как самые значимые входы плутон, нептун и марс. Есть у кого-то идеи что на вход подавать?