Эта статья предназначена исключительно для аудитории, которая не знает, что за хрень это машинное обучение (ML)? Для тех, кто чувствует себя обделенным, когда видят, что люди говорят об этом.
Вам совсем не обязательно иметь технический опыт. Уверяю вас, после прочтения этой статьи у вас будет достаточно информации, чтобы принять участие в обычных беседах о машинном обучении.
Начиная с широкого определения ML — это…
Машины, имитирующие и адаптирующие человеческое поведение.
Например, позвольте мне задать вам викторину…
Как вы попали в 81 ???
Именно такому поведению мы пытаемся научить машины. Мы пытаемся научить машины «учиться на опыте».
Алгоритмы машинного обучения используют вычислительные методы для «изучения» информации непосредственно из данных, не полагаясь на заранее определенное уравнение в качестве модели.
Алгоритмы адаптивно улучшают свою производительность по мере увеличения количества образцов, доступных для обучения.
Печально известные алгоритмы машинного обучения находят естественные закономерности в данных, получают информацию и предсказывают неизвестное для принятия лучших решений.
Есть два типа методов машинного обучения:
Не волнуйтесь! Один шаг за раз.
Находит закономерности (и разрабатывает прогнозные модели), используя как входные, так и выходные данные.
Все методы контролируемого обучения имеют форму классификации или регрессии.
Классификация :
Классификация используется для предсказания дискретных ответов.
Например:
Выиграет ли Россия матч по футболу или проиграет? Является ли электронное письмо СПАМОМ или ПОДЛИННЫМ?
WIN, LOSE, SPAM, GENUINE — это предопределенные классы. И выход должен попадать в эти категории в зависимости от входа.
Регрессия :
Регрессия используется для прогнозирования непрерывных ответов.
Например:
Динамика цен на фондовом рынке, прогноз погоды и т. д.
Находит шаблоны только на основе входных данных. Этот метод полезен, когда вы не совсем уверены, что искать. Часто используется для исследовательского анализа необработанных данных.
Большинство методов обучения без учителя являются формой кластерного анализа.
Кластерный анализ:
В кластерном анализе вы группируете элементы данных, которые имеют некоторую степень сходства на основе значений характеристик.
В конце у вас будет набор разных групп (допустим, таких групп от A до Z). Элемент данных (d1) в одной группе (A) очень похож на другие элементы данных (d2 — dx) в той же группе (A), но d1 значительно отличается от элементов данных, принадлежащих к разным группам (B — Z) .
Вернемся к нашему примеру…
Наша викторина была примером контролируемого обучения — методики регрессии.
Надеюсь, вам понравилась эта статья. Поделитесь своими взглядами и сомнениями, если таковые имеются, в разделе комментариев ниже. Спасибо, что зашли! Пока. 🙂