Он представляет собой комплексный «экзамен» для больших языковых моделей, который состоит из 18 заданий различной природы и сложности. Они позволяют оценить, как модель справляется с текстами объемом от 4 тысяч до 128 тысяч структурных элементов, что сопоставимо с размерами большой заметки в СМИ и длинной книги. В рамках этих заданий ИИ должен найти в тексте конкретную фразу, ответить на вопросы по содержанию текста, а также связать воедино несколько фактов, разбросанных по разным частям документа, или решить описанные в нем задачи.