Демонтаж ИИ и машинного обучения в поиске

Интересный интернет

В последние годы искусственный интеллект (ИИ) и машинное обучение (Machine Learning) стали неотъемлемой частью нашей повседневной жизни․ Они используются во многих сферах, включая поисковые системы․ Однако, многие пользователи выражают озабоченность относительно приватности данных и возможности контроля над решениями, которые принимает ИИ․ Это приводит к возникновению потребности в демонтаже ИИ и машинного обучения в поиске․

Контроль над решениями ИИ

Одной из основных проблем с использованием ИИ и машинного обучения в поиске является отсутствие возможности полного контроля над принятыми решениями․ Алгоритмы ИИ и машинного обучения работают на основе обучения на больших объемах данных, что делает их принятие решений сложными для пользователя․

В свете этого, важно разработать подходы, которые позволят пользователям контролировать и управлять решениями, принимаемыми ИИ․ Это может включать в себя возможность настройки параметров обучения, выбора источников данных или использования альтернативных алгоритмов․

Приватность данных

Еще одной проблемой использования ИИ и машинного обучения в поиске является приватность данных․ Поисковые системы собирают и анализируют огромные объемы данных пользователей для улучшения релевантности результатов поиска․ Однако, это вызывает опасения с точки зрения конфиденциальности личной информации․

Для решения этой проблемы, поисковые системы должны обеспечивать прозрачность и контроль над собираемыми данными․ Пользователям следует предоставлять возможность выбора, какая информация будет собираться и использоваться для обучения ИИ․ Кроме того, компании должны строго соблюдать политику конфиденциальности и защищать данные пользователей․

Этические аспекты

Использование ИИ и машинного обучения в поисковых системах также вызывает этические вопросы․ Алгоритмы могут быть предвзятыми или дискриминирующими в своих решениях, основанных на обучении на нерепрезентативных данных или несоответствующих метриках․ Это может привести к некорректным и пристрастным результатам поиска․

Чтобы минимизировать этические проблемы, компании должны осуществлять проверку и контроль обучающих данных, обеспечивать разнообразие и объективность в обучении моделей ИИ․ Кроме того, необходима более широкая общественная дискуссия и участие в разработке и регулировании ИИ в поиске․

Демонтаж искусственного интеллекта и машинного обучения в поисковых системах является важным вопросом в сфере информационных технологий․ Компании должны уделить больше внимания контролю над решениями ИИ, приватности данных и этическим аспектам, чтобы обеспечить лучший пользовательский опыт и защитить интересы пользователей․

ЧИТАТЬ ЕЩЁ:  3 способа улучшить распределение ссылочного капитала и уловить упущенные возможности

В мире искусственного интеллекта и машинного обучения существует множество уровней, найти которые может быть достаточно сложно. Существует множество терминов, которые могут привести к путанице, если у вас нет базового понимания ландшафта. В этой статье специалист Эрик Энге излагает основные понятия и старается сделать все простым для понимания. Это также первая из серии статей из четырех частей, охватывающих многие из наиболее интересных аспектов ландшафта искусственного интеллекта.

Другие три статьи из этой серии

  • Вводное редактирование естественного языка: как его использовать и как им пользоваться
  • Современные алгоритмы искусственного интеллекта Google: RankBrain, Bert, Mum и Smith

Основные сведения о ТН

Существует так много различных терминов, что трудно определить, что все они означают. Итак, давайте начнем с определения:.

  • Искусственный интеллект — относится к интеллекту, проявляемому машинами, в отличие от физического интеллекта, присущего людям и другим животным.
  • Искусственный общий интеллект (AGI) — это уровень интеллекта, при котором машина может справиться с любой задачей, стоящей перед человеком. Его пока не существует, но многие люди пытаются его создать.
  • Машинное обучение — это подмножество искусственного интеллекта, которое использует данные для многократного тестирования и обучения выполнению определенных задач.
  • Глубокое обучение — это подмножество машинного обучения, которое использует особо сложные нейронные сети для решения более сложных задач машинного обучения.
  • Редактирование естественного языка (NLP) — это область TN, которая фокусируется конкретно на обработке и понимании языка.
  • Нейронные сети — это один из самых популярных алгоритмов машинного обучения, который пытается смоделировать взаимодействие нейронов в мозге.

Все они тесно связаны друг с другом, и полезно посмотреть, как все они сочетаются между собой.

Демонтаж ИИ и машинного обучения в поиске

В целом, искусственный интеллект включает в себя все эти понятия, глубокое обучение является подмножеством машинного обучения, а обработка физических языков использует широкий спектр алгоритмов TN для лучшего понимания языка.

Примерное изображение работы нейронной сети

Существует множество различных типов алгоритмов машинного обучения. Наиболее известным из них является алгоритм нейронной сети, который затем предоставляет небольшую рамку для охвата.

Рассмотрим проблему определения заработной платы сотрудника. Например, сколько вы платите человеку с 10-летним опытом работы? Чтобы ответить на этот вопрос, можно собрать некоторые данные о том, сколько платят другим людям с их стажем работы. Это может выглядеть примерно так

Демонтаж ИИ и машинного обучения в поиске

Используя эти данные, вы можете легко рассчитать, сколько вы должны платить этому сотруднику, построив линейную диаграмму.

Демонтаж ИИ и машинного обучения в поиске

Для такого человека это означает зарплату свыше 90 000 долларов США в год. Однако каждый из нас может сразу понять, что

Демонтаж ИИ и машинного обучения в поиске

Это гораздо более сложная проблема, но ее относительно легко решить с помощью машинного обучения. Однако мы еще не закончили усложнять факторы, влияющие на заработную плату. Это связано с тем, что ваше местоположение также оказывает значительное влияние. Например, за техническую работу в районе залива Сан-Франциско платят гораздо больше, чем за такую же работу во многих других регионах страны. В основном это связано с огромной разницей в стоимости жизни.

ЧИТАТЬ ЕЩЁ:  3 стратегии контент-маркетинга для поддержки успеха SEO

Демонтаж ИИ и машинного обучения в поиске

Основной подход, используемый нейронной сетью, заключается в использовании переменных (должность, годы опыта, уровень производительности) для вывода правильного уравнения, а затем использование этого уравнения для расчета потенциальной заработной платы и проверки того, насколько хорошо оно соответствует данным для реальных людей. Этот процесс настройки нейронных сетей называется "градиентным спуском". Простой английский способ описать это — назвать это "последовательным подходом".

Исходные данные о зарплате — это то, что нейронная сеть использует в качестве "обучающих данных", чтобы знать, когда она построит алгоритм, соответствующий реальному опыту. Рассмотрим простой пример, который начинается с исходного набора данных, содержащего только данные о годах опыта и зарплате.

Демонтаж ИИ и машинного обучения в поиске

Чтобы упростить пример, предположим, что используемая для этого нейронная сеть понимает, что 0 лет стажа равны зарплате в $45 000, и что основная форма уравнения такова: зарплата = стаж * X + $45 000. Чтобы получить правильное уравнение для использования, необходимо рассчитать значение X. В качестве первого шага нейронная сеть предполагает, что цена X составляет 1500 долларов. На практике эти алгоритмы делают эти начальные предположения случайным образом, но пока этого достаточно: тестируя для цены около $1,500, мы получаем

Демонтаж ИИ и машинного обучения в поиске

Как видно из полученных данных, вычисленные значения очень низкие. Нейронная сеть предназначена для сравнения рассчитанного значения с фактическим и предоставления его в качестве обратной связи. Это можно использовать для проверки второй догадки о правильности ответа. В этом примере давайте установим $3,000 в качестве следующего предположения как правильное значение для X. На этот раз результаты следующие.

Демонтаж ИИ и машинного обучения в поиске

Как видите, результат улучшился. Это хорошо. Однако вам придется угадывать снова, так как вы недостаточно близки к правильному значению. Так что давайте попробуем на этот раз оценить 6000 долларов США.

Демонтаж ИИ и машинного обучения в поиске

Интересно, что мы видим, что диапазон ошибок немного увеличился, но теперь он очень высок! Возможно, вам придется немного подкорректировать уравнение. Давайте попробуем $4500:

Демонтаж ИИ и машинного обучения в поиске

Теперь мы видим, что подошли довольно близко! Мы можем продолжать пробовать дополнительные значения, чтобы увидеть, насколько мы можем улучшить результаты. Это подводит нас к еще одному важному значению машинного обучения. От этого зависит точность алгоритма и то, когда следует прекратить итерации. Однако, для целей приведенного здесь примера, мы довольно близки и надеемся, что вы сможете понять, как это работает.

В этом примере упражнения машинного обучения, X + 45 000 долларов (или другой

  • Приведенный выше пример машинного обучения является примером того, что мы называем "контролируемым машинным обучением". Мы называем его контролируемым, потому что, учитывая набор обучающих данных, содержащих целевые выходные значения, алгоритм может использовать их для генерации уравнений, которые дают такой же (или почти такой же) результат на выходе. Существует также класс алгоритмов машинного обучения, которые выполняют "несамостоятельное машинное обучение".
  • Этот класс алгоритмов также предоставляет набор входных данных, но не предоставляет пример выходных данных. Алгоритмы машинного обучения должны самостоятельно просматривать данные и находить в них смысл. Это может звучать так же пугающе, как человеческий интеллект, но нет, мы еще не дошли до этого. Давайте продемонстрируем это на двух примерах из мира машинного обучения такого типа.
ЧИТАТЬ ЕЩЁ:  Согласование контента и SEO для успешного поиска

Примером неконтролируемого машинного обучения является Google News, где Google имеет системы для обнаружения статей, которые получают наибольший трафик от новых горячих поисковых запросов, предположительно вызванных новыми событиями. Но как узнать, что все статьи посвящены одной и той же теме? Вы можете выполнять традиционное сопоставление релевантности так же, как и обычный поиск в Google News, но с использованием алгоритма, помогающего определить сходство между контентом.

Как показано в примере на изображении выше, Google успешно сгруппировал ряд статей, связанных с принятием законопроекта об инфраструктуре 10 августа 2021 года. Как и ожидалось, статьи, посвященные описанию события и самого законопроекта, могут быть весьма схожи по содержанию. Распознавание этих сходств и поиск статей — это еще один пример несамостоятельного машинного обучения в действии.

Еще одна интересная категория машинного обучения — это так называемые "рекомендательные системы". На практике это можно наблюдать на сайтах электронной коммерции, таких как Amazon, и киносайтах, таких как Netflix: на Amazon надпись "часто покупают вместе" может появляться под объявлениями на странице товара. На других сайтах он может быть помечен как "Люди, купившие это, также купили это".

Такие сайты, как Netflix, используют аналогичную систему для создания рекомендаций по фильмам. Они могут быть основаны на установленных предпочтениях, рейтинге фильмов или истории выбора фильмов. Обычный подход заключается в сравнении фильмов, которые вы смотрели и оценили высоко, с фильмами, которые смотрели и оценили аналогичным образом другие пользователи.

Например, если вы достаточно высоко оценили четыре боевика, а другой пользователь (назовем его Джон) также высоко оценил боевики, система может предложить другие фильмы, которые видел Джон, но не видели вы. Этот общий подход называется "коллаборативной фильтрацией" и является одним из нескольких подходов к построению рекомендательной системы.

Демонтаж ИИ и машинного обучения в поиске

 

Лекция «Искусственный интеллект и машинное обучение: вызовы и возможности для экономики»

Оцените статью