Baidu, Inc. (百度) — ведущий технологический гигант из Китая, основанный в 2000 году Робином Ли и Эриком Сюй. Компания, зарегистрированная на Каймановых островах с операционной штаб-квартирой в пекинском районе Хайдянь. За два десятилетия компания прошла путь от классического поискового сервиса до ведущего разработчика платформ и решений в области искусственного интеллекта, сыграв заметную роль в развитии национальной AI-экосистемы.
Baidu начинала как китайский аналог Google, но с 2014 года, после назначения доктора Эндрю Нга главным научным сотрудником, взяла курс на трансформацию в AI-компанию. Первым крупным шагом стало создание PaddlePaddle (2016) — первого в Китае open-source фреймворка для глубокого обучения, который стал технологической основой для всех последующих разработок.
В 2019 году Baidu представила ERNIE 1.0 (Enhanced Representation through kNowledge IntEgration) — архитектуру, интегрирующую графы знаний непосредственно в процесс предобучения языковых моделей. ERNIE 2.0 (2019) добавила continual multitask learning, а ERNIE 3.0 (2021) объединила понимание и генерацию текста, достигнув state-of-the-art результатов в 54 китайскоязычных NLP-задачах. Модель ERNIE 3.0 Titan с 260 миллиардами параметров закрепила позицию Baidu как серьёзного игрока в области больших языковых моделей.
Основным научным вкладом Baidu в развитие LLM стал knowledge enhancement подход: интеграция структурированных знаний на этапе предобучения через маскирование сущностей и фраз, а не отдельных токенов. Это позволило моделям ERNIE лучше понимать семантические связи и контекст, особенно в иероглифических языках.
Исторически Baidu придерживалась проприетарного подхода, но появление DeepSeek кардинально изменило стратегию. В феврале 2025 года CEO Робин Ли объявил о планах открытия моделей ERNIE, и 30 июня 2025 года компания выпустила семейство ERNIE 4.5 под лицензией Apache 2.0.
Таким образом, Baidu занимает уникальное положение в отрасли – она реализует фундаментальные исследования в сочетании с выпуском успешных коммерческих продуктов и open-source решений. Компания является одним из немногих китайских tech-гигантов, предлагающих полный AI-стек: от чипов и облачной инфраструктуры до foundation-моделей и приложений.