Article

Open-Source Language AI Challenges Big Tech’s Models

BLOOM aims to address the biases that machine-learning systems inherit from the texts they train on.

Elizabeth Gibney

Nature, 2022

Read the article

Read offline

1×

Войдите, чтобы прослушать аудиоверсию краткого изложения.

Editorial Rating

Мы составляем краткие изложения книг*, помогающих читателям разбираться в законах современного мира и менять его к лучшему. Материалы, которые мы отбираем для нашей библиотеки, должны отвечать по крайней мере одному из наших двух основных критериев:

Информативно. – Вы получите такую информацию, которая позволит вам более взвешенно и эффективно принимать решения.

Полезно. – Вы получите такие практические советы, которые помогут вам лучше делать то, чем вы занимаетесь.

Каждому материалу мы присваиваем рейтинг от 1 до 10 на основе этих двух критериев. Наш рейтинг поможет вам распределить книги в вашем списке для чтения по шкале от добротных (5) до выдающихся (10). По книгам, которые мы оцениваем ниже 5, краткие изложения не составляются. Вот что означают цифры рейтинга:

10 – Великолепно. Полезная и/или информативная книга, которая, помимо соблюдения высочайших стандартов во всех отношениях, выделяется даже среди лучших книг. Как правило, это книга, сразу ставшая классикой, которую должен прочитать каждый.
9 – Отлично. Полезная и/или информативная книга, очень хорошо организованная и написанная, имеющая множество достоинств и не имеющая недостатков, которые заслуживали бы упоминания.
8 – Очень хорошо. Полезная и/или информативная книга, которая имеет много важных достоинств, но при этом не может быть названа выдающейся: например, освещает последние открытия в своей области и написана известным специалистом, но в отношении стиля оставляет желать лучшего.
7 – Хорошо. Полезная и/или информативная книга, имеющая два и более важных достоинства: например, очень увлекательно рассказывающая о новых идеях в какой-то предметной области.
6 – Достойно внимания. Полезная и/или информативная книга, которая обращает на себя внимание по крайней мере каким-то одним аспектом, например четкой организацией материала.
5 – Добротно. Полезная и/или информативная книга, несмотря на очевидные недостатки. Например, в одной области автор может давать разумные советы, а в других или содержится много повторов, или нет ничего особенно ценного.

*getAbstract работает не только с книгами. Мы составляем краткие изложения всех видов контента, которые могут быть полезны нашей аудитории: помимо книг это статьи, отчеты, видео и подкасты. То, что мы говорим здесь о книгах, относится ко всем видам материалов, которые мы пересказываем.

Qualities

Analytical
Visionary
Engaging

Рейтинг помогает вам понять, какова ценность книги в соответствии с двумя нашими основными критериями. Но он ничего не сообщает о ее конкретных особенностях. Поэтому мы используем набор из 20 характеристик, которые призваны прояснить, в чем именно состоят достоинства книги.

Практические советы – вы получите рекомендации, которые практически осуществимы на вашем рабочем месте или в повседневных ситуациях.
Аналитический подход – вы поймете внутренние взаимосвязи и закономерности в рассматриваемой проблеме.
История вопроса – вы узнаете об истории и контексте проблемы, что позволит вам правильно провести анализ или совершить хорошо взвешенный шаг.
Особое мнение – вы познакомитесь с аргументами, которые расходятся с преобладающей в настоящий момент точкой зрения.
Подробное освещение – вы увидите все аспекты предмета, описанные исчерпывающим образом.
Конкретные примеры – вам предложат практические советы, которые иллюстрируются рассказами об их применении на практике.
Выразительный язык – вы получите удовольствие от мастерски написанного текста или речи, являющейся образцом ораторского искусства.
Увлекательно – вам будет трудно оторваться от текста или аудио.
Неизвестные факты – вы узнаете об удивительных фактах или умозаключениях.
Начальный уровень – информация будет для вас полезной, если вы новичок, у которого нет знаний по данной теме или опыта.
Продвинутый уровень – информация или рекомендации будут полезны вам как специалисту.
Острая проблема – вы окажетесь в гуще спора по поводу одного из насущных вопросов современности.
Новаторская концепция – вы узнаете о свежих идеях, концепциях, новых продуктах или тенденциях.
Рассказ инсайдера – вы познакомитесь с мнением человека, который имеет особый доступ к сведениям по обсуждаемой теме.
Источник вдохновения – вам захочется сразу же опробовать на практике то, о чем вы прочитали.
Обзор – вы получите общее описание предмета с упоминанием всех основных моментов.
Научные данные – вы узнаете о цифрах и фактах, подкрепленных научными исследованиями.
Взгляд в будущее – вы познакомитесь с авторской картиной будущего и тем, как оно может на вас повлиять.
Четкая структура – хорошая организация материала значительно облегчит вам восприятие концепции или применение рекомендаций на практике.
Спорно – вы познакомитесь с любопытными, но неоднозначными выводами.

Recommendation

Currently in its final weeks of training, the BLOOM model for natural language processing is almost ready for full launch. With parameter sets rivaling those used by Google and OpenAI, the system’s originators seek to correct biases inherent in many systems that make them seem all too human – in the worst ways. Anyone who designs or uses AI should read this eye-opening report, and perhaps consider signing up for a test drive.

Summary

Scientists designed the BLOOM natural language processing model to correct AI text biases.

Because machine learning systems tend to inherit errors from training material, researchers warn of possible harm caused by AI models that process and generate text.

A multinational team of about a thousand mostly academic volunteers tried to reduce such problems by breaking “big tech’s” grip on natural language processing models. Fueled by $7 million in allocations for computer time, the BLOOM [BigScience Language Open-science Open-access Multilingual] model rivals those conceived by OpenAI and Google – but offers multilingual and open-source access. BigScience collaborators introduced a preliminary BLOOM model in June 2022.

Such systems can display humanlike qualities, including societal and ethical flaws inherent in people.

Until now, researchers have experienced difficulty in gaining access to privately-held models.

BLOOM can tackle a variety of AI-based research projects.

Biological classifications...

About the Author

Elizabeth Gibney is a senior physics reporter at Nature. She has written for Scientific American, the BBC and CERN.

Open-Source Language AI Challenges Big Tech’s Models

BLOOM aims to address the biases that machine-learning systems inherit from the texts they train on.

Read offline

Editorial Rating

Qualities

Recommendation

Summary

Scientists designed the BLOOM natural language processing model to correct AI text biases.

BLOOM can tackle a variety of AI-based research projects.

About the Author

My Highlights

Comment on this summary

More on this topic

Learners who read this summary also read

Related Channels