
Большинство людей выбирают Обнимая лицоВзглянуть на стену с названиями моделей и тут же закрыть страницу через 30 секунд. Большая ошибка.
Пока все спорят о том, какой именно AI Этот инструмент стоит своих денег, десятки тысяч разработчиков незаметно используют Hugging Face для запуска, тонкой настройки и... судно AПриложения на базе I-технологий — совершенно бесплатно.'s Это не просто библиотека моделей.'s Платформа, где Google, Meta, Mistral и независимые разработчики работают в одном пространстве.
Более 1 миллион моделей, более 500 тысяч наборов данных и бесплатный хостинг приложений. — под одним аккаунтом. Здесь's Полное описание того, что это такое и как этим пользоваться.
Что на самом деле представляет собой «обнимающее лицо» (большинство людей неправильно это понимают)?

"GitHub машинного обученияМетка «Hugging Face» используется довольно часто. Она работает в одном направлении — публичные репозитории, контроль версий, вклад сообщества. Но она быстро разваливается. Hugging Face также выполняет вывод данных в реальном времени, размещает приложения на основе ИИ и предоставляет полноценную инфраструктуру для обучения. GitHub ничего из этого не делает.
Сама компания начинала как стартап по разработке чат-ботов на основе обработки естественного языка, а затем перешла к разработке программного обеспечения с открытым исходным кодом. AI с помощью инструментов, и ни разу не пожалел. Публичная платформа. is fбесплатные и ориентированные на сообществоКорпоративные продукты — это их основной источник дохода. Для начинающих бесплатный тарифный план покрывает все необходимое. Модели публикуются здесь. до Они попадают в заголовки новостей — если в области ИИ появляется что-то новое, это первым делом появляется на Hugging Face.
Три столпа — запомните их прежде всего.
На сайте Hugging Face всё разделено на три основных раздела:
| мародерство | Что это такое? | Почему это имеет значение |
|---|---|---|
| Модели | Более 1 млн предварительно обученных AI ухода | Полностью откажитесь от обучения с нуля. |
| Datasets | Исходные данные для обучения и тестирования | Стандартизированные, готовые к загрузке данные |
| Spaces | Бесплатный хостинг AI Программы | Тестируйте модели, не затрагивая код развертывания. |
Освойте все три компонента — они постоянно взаимодействуют в процессе разработки.
Центр моделирования — место, где вы будете проводить большую часть своего времени.
Панель фильтров — ваш лучший помощник: тип задачи, фреймворк (PyTorch, TensorFlow, JAX), язык, лицензия и размер модели. Сортировать по наиболее загруженный проверенные в боях варианты; сортировка по Недавно обновленные Когда вам нужны свежие варианты.

К каждой модели прилагается инструкция — прочтите её. В разделе «Предназначение» указано, для чего была создана данная модель; раздел ограничений показывает, где возникают ошибки. Эта вторая часть ценнее любого показателя производительности. Категории моделей охватывают НЛП (классификация текста, суммаризация, перевод, ответы на вопросы), компьютерное зрение (классификация изображений, обнаружение объектов, генерация), аудио (распознавание речи, синтез речи) и мультимодальные задачи например, визуальные ответы на вопросы.
Новички часто упускают из виду одну вещь: не все модели доступны для бесплатного скачивания. Модели с ограниченным доступом, такие как... Мета's Лама Для доступа требуется предварительное одобрение. После одобрения вы проходите аутентификацию с помощью токена доступа. Всегда проверяйте лицензию перед созданием проекта — некоторые модели полностью запрещают коммерческое использование.
Библиотека Трансформеров — Код, лежащий в основе половины AI Мир
transformers библиотека — это унифицированный Питон пакет Это стандартизирует способ загрузки и запуска любой модели в хабе, используя PyTorch, TensorFlow и JAX с одним и тем же API.

pipeline() Функция — это то, с чего следует начать большинству начинающих: она объединяет токенизацию, загрузку модели и постобработку в один вызов. Анализ настроенийГенерация текста, классификация изображений — все это следует одному и тому же шаблону. Как только вам потребуется точный контроль над результатами, переходите к написанию собственного кода для вывода. До тех пор конвейеры обрабатывают все.
Не пропускайте токенизацию. Необработанный текст нельзя напрямую передать в модель. AutoTokenizer Он обрабатывает преобразование и всегда автоматически сопоставляет правильный токенизатор с правильной контрольной точкой. Несоответствие токенизаторов приводит к наиболее запутанным ошибкам, с которыми сталкиваются новички, — и их можно полностью избежать.
| Сложность задачи | Название трубопровода | Пример модели |
|---|---|---|
| Анализ настроений | text-classification | дистиллят-база-без кожуха |
| Генерация текста | text-generation | Мистраль-7Б |
| Суммирование | summarization | facebook/bart-large-cnn |
| Распознавание речи | automatic-speech-recognition | openai/whisper-base |
| Классификация изображений | image-classification | google/vit-base-patch16 |
Наборы данных и пространства — две функции, которые никто не использует достаточно часто.
datasets Библиотека загружает данные в формате Apache Arrow — быстро, эффективно с точки зрения использования памяти и предназначена для обработки наборов данных, которые не помещаются в оперативную память. load_dataset("name", split="train") Это всё, что нужно для начала. Прежде чем выбрать какой-либо набор данных для обучения, используйте Data Studio В браузере можно предварительно просмотреть и отфильтровать изображение, не написав ни единой строки кода.
Spaces — это место, где AI Демоверсии запускаются бесплатно. Ваше приложение получает URL-адрес, которым можно поделиться, за считанные минуты без каких-либо усилий со стороны DevOps. Бесплатный уровень с использованием ЦП подходит для несложных демоверсий; платные Spaces с поддержкой графического процессора обрабатывают более ресурсоемкие модели.
Используйте Gradio Для быстрой демонстрации моделей с минимальным количеством кода используйте стримлит Когда вашему приложению требуется более насыщенный данными макет панели управления, клонирование популярного пространства — самый быстрый способ начать: выберите один из вашей категории, сделайте форк и настройте его.
Правильная настройка вашей учетной записи
Бесплатный тариф включает просмотр моделей, использование CPU Spaces, ограниченное количество вызовов API и полный доступ к сообществу. В тариф Pro добавляются приоритетное использование GPU Spaces, расширенные возможности вывода результатов и частные репозитории. Для большинства начинающих бесплатного тарифа достаточно.
Сгенерируйте токен доступа в разделе Настройки → Токены доступаТокены чтения используются для загрузки; токены записи необходимы для отправки моделей или наборов данных. Аутентификация в Python осуществляется с помощью huggingface_hub.login()Для установки:

колотить
pip install transformers datasets huggingface_hub
Добавить accelerate, peft и trl Если в планах есть доработка. Google Colab — самая быстрая среда для абсолютных новичков — и всё это бесплатно. GPU :Локально ничего настраивать не нужно.
Запустите свою первую модель, а затем адаптируйте её под себя.
Для анализа настроений: призывают pipeline("text-classification"), передайте строку, прочитайте label и score назад. Для генерации текста: используйте max_new_tokens, temperature и do_sample контролировать, насколько креативным или последовательным будет результат. То же самое. pipeline() Этот шаблон подходит для перевода, распознавания речи и классификации изображений — API не меняется, меняется только название задачи.
Когда что-то ломается:
После того, как освоены основы, следующим шагом становится тонкая настройка. Предварительно обученные модели универсальны; модели с тонкой настройкой — точны. Тонкая настройка предпочтительнее, чем подсказки, когда вы работаете с данными, специфичными для конкретной предметной области, нуждаетесь в согласованном поведении или хотите сократить затраты на вывод, используя более компактную специализированную модель.
ПЕФТ Замораживает большую часть модели и обучает только легковесные адаптеры — видеокарта за 10 000 долларов не требуется. QLoRA Технология квантования идет еще дальше, позволяя выполнять тонкую настройку 7-битной модели параметров на одном потребительском графическом процессоре.
Trainer API управляет всем циклом — пакетной обработкой, оценкой, контрольными точками — и отправка данных обратно в центральный узел занимает всего одну строку кода после завершения работы.
Вывод без собственного сервера
Размещенный API для вывода данных мгновенно предоставляет REST-конечную точку для любой общедоступной модели. Бесплатный уровень имеет ограничения по количеству запросов — подходит для тестирования, но не для производственной среды. Для реальных приложений... Конечные точки вывода Предоставить выделенный, частный API, который автоматически масштабируется до нуля в режиме ожидания, что позволяет поддерживать приемлемые затраты при переменном трафике.

Когда конфиденциальность данных или задержка не подлежат обсуждению, самостоятельный хостинг с TGI (вывод в процессе генерации текста) or vLLM это путь, готовый к внедрению в производство.
Сообщество, таблицы лидеров и почему это лучше всего остального.
Открыть таблицу лидеров LLM Ранжирует модели по результатам тестирования — полезно для отбора кандидатов, но всегда проверяйте результаты на реальном примере использования, прежде чем доверять оценкам. Организационные учетные записи позволяют командам управлять общими коллекциями моделей с контролируемым доступом; Meta AI, Google и Eleuther.AI Все учетные записи организаций работают непосредственно в хабе.
Подписка на исследователей и организации позволяет получать информацию о новых моделях в режиме реального времени, без необходимости следить за социальными сетями.
| Платформа | Open Source | Модельное разнообразие | Уровень бесплатного пользования | Инструменты тонкой настройки |
|---|---|---|---|---|
| Обнимая лицо | ✅ Полный | ✅ 1 млн+ | ✅ Щедрый | ✅ Полный стек |
| Концентратор TensorFlow | ✅ да | 🔶 Ограничено | ✅ да | ❌ Базовый |
| Модельный сад Google | ❌ Частичный | 🔶 Подборка | 🔶 Только GCP | 🔶 Только GCP |
| ОткрытоAI API | ❌ нет | ❌ Закрыто | ❌ Только платно | 🔶 Ограничено |
Ошибки, которые отнимут у вас часы работы
- Выбирать самую большую модель, когда меньшая, специализированная модель окажется быстрее и дешевле?
- Пропускаем карту модели's раздел ограничений, прежде чем что-либо над ним строить.
- Не фиксируются версии моделей — модели обновляются незаметно, и выходные данные изменяются без предупреждения.
- Использование бесплатного API Inference для любых задач, требующих стабильной работы в производственной среде.
- Передача необработанного текста непосредственно в модель без предварительной обработки токенизатором.
AiMojo рекомендует:
Куда пойти отсюда
Обнимая лицо's бесплатные курсы at hf.co/learn Курс охватывает обработку естественного языка, аудио и глубокое обучение с подкреплением в структурированных программах, разработанных специально для этой платформы. Лучший первый проект: тонкая настройка текстового классификатора на пользовательском наборе данных, его интеграция с Gradio и развертывание в качестве пространства.
Эта единая сборка затрагивает модели, наборы данных, тонкую настройку и пространства за один раз. После этого's Запустите модель, загрузите ее и составьте подробную карточку модели, указав предполагаемое использование, обучающие данные и ограничения.
То, что's как осуществляется полезный общественный вклад, и это's как начать создавать реальное присутствие в интернете ИИ с открытым исходным кодом пространстве.

