Данные находятся в открытом доступе, чтобы предоставить ценные ресурсы для обучения ИИ, сообщает Ferra.
Эта база включает в себя книги из проекта Google Books, на которые больше не распространяется авторское право.
Коллекция в пять раз больше, чем известный набор данных Books3. Она охватывает самые разные жанры, от классики вроде Шекспира и Диккенса до нишевых произведений на разных языках.
Стартапам и исследователям в области ИИ предоставят доступ к «высококачественным данным», которые обычно имеют только крупные технологические компании.
Набор данных будет доступен для использования наряду с другими лицензированными материалами для построения моделей ИИ.
Пенсия 2026
Досрочное снятие пенсий: почему МВФ и ОЭСР были против такого решения
Налоговый кодекс РК 2026
В Налоговый кодекс вносятся поправки в связи с созданием Курултая и Қазақстан Халық Кеңесі
АЭС
«Не такие уж и лёгкие партнёры»: эксперт объяснил слова Путина о Казахстане
Алматы
В Алматы снесли незаконно построенный рынок
МРП 2026
Штрафы подросли: за какие нарушения казахстанцам придётся платить до 130 тыс. тенге
Землетрясение
Землетрясение по Генплану: куда бежать алматинцам, и почему убежище может оказаться в «Бахусе»
Бокс
Назым Кызайбай принесла Казахстану первое золото Кубка мира по боксу в Китае
Футбол
МВД Казахстана предупреждает родителей: дети могут передать пароли от аккаунтов мошенникам в интернете
Астана
В Астане на два дня частично закроют движение на перекрестке
Азербайджан
Из Казахстана в Азербайджан появились три новых маршрута
Шымкент
Бывшую свалку превратили в экопарк в Шымкенте
Иран
Иран ввел новые правила прохода судов через Ормузский пролив
Нефть
Персонал МВФ завершил визит в Казахстан
Закон
Какие законы подписал глава государства
Война
Через 40 лет исчезнет половина человечества? Почему прогноз 1798 года становится реальностью
Туризм
Руководитель турагентства оставил без отдыха десятки людей в Актобе
Медицина
Глава государства наградил медицинских работников в преддверии профессионального праздника