Разработчики «Эльбруса» выложили в открытый доступ систему команд процессора

08.06.2020      26069

МЦСТ, создающая отечественные «Эльбрус», предоставила всем желающим доступ к набору микропроцессорных команд. Документация распространяется по открытой лицензии. 

Любое использование

Компания МЦСТ представила руководство по разработке программ, совместимых с процессором «Эльбрус». Документация включает детальное описание ассемблера и системы команд чипов, информацию об особенностях работы фирменного компилятора LCC, советы по портированию С и С++ приложений на отечественный процессор, сведения о приемах по оптимизации программ и повышению производительности устройства. 

Руководство по разработке под платформу «Эльбруса» выложено на официальном сайте МЦСТ. Оно распространяется по лицензии Creative Commons (CC-BY 4.0), которая позволяет сторонним разработкам использовать и изменять продукт, в том числе и для коммерческих целей. Обязательно лишь указание авторов исходников. 

Подробности документации

Документация предназначена для разработчиков, желающих выпускать Linux-приложения для устройств на базе процессора «Эльбрус». В материалах МЦСТ изложены сведения об адаптации уже написанного кода к отечественному чипу, перечислены приемы компиляции и отладки программ. 

В документе подробно описаны интерфейсы и внешние особенности платформы, важные для разработки и портирования ПО. Для повышения производительности приведены сведения об эффективности различных способов преобразования кода, включая методику распараллеливания исполняемого кода на уровне команд ассемблера. Для упрощения написания архитектурно-зависимого кода руководство содержит подробное описание интерфейсных программных соглашений и команд микропроцессора.

Документация также рассматривает теоретические основы построения вычислительной платформы на микроархитектуре «Эльбрус», особенности применения оптимизированных библиотек, рекомендации по улучшению производительности приложений с эмпирическими правилами для работы в стандартных ситуациях.

Об архитектуре

Документация детально рассматривает архитектуру процессоров «Эльбрус». В ней представлены сведения обо всех актуальных моделях чипов, в том числе о 4-ядерном «Эльбрус-4C», 8-ядерных «Эльбрус-8C» и «Эльбрус-8CB». Описана разница в исполнении команд скалярными и суперскалярными процессорами, подробно разъяснена конвейеризация и параллельная группировка в процессе выполнения команд.

Рассмотрение архитектуры «Эльбрусов» также включает принципы применения «очень длинных машинных команд» (VLIW), специфику использования компилятора чипа для анализа зависимостей и оптимизации порядка исполнения операций. Детально описаны прочие отличительный черты отечественной разработки от «традиционных» процессоров с архитектурой RISC/CISC.


Автор:
Аналитик


См. также

Новость ИТ-Новость

Arduino IDE 2.0 получила стабильную версию, в которой появилась поддержка автодополнения кода и темная тема. Разработка заняла несколько лет. Программа распространяется бесплатно.

23.09.2022    12743    VKuser24342747    0       

2

Новость Импортозамещение ИТ-Новость Облачные технологии

«Ростелеком» создаст облачную платформу на «Эльбрусах» для государственных предприятий и бизнеса. Организации смогут получить частное облако, работающее на полностью российских технологиях.

25.10.2021    21703    VKuser24342747    1       

1

Новость Импортозамещение ИТ-Новость Минпромторг

Ведомство направило российским программистам письмо, в котором обратилось с просьбой ускорить адаптацию своих разработок под процессоры «Эльбрус» и «Байкал».

20.08.2021    20858    VKuser24342747    13       

2

Новость ИТ-Новость

Специалисты ARM представили пластиковую версию процессора Cortex-M0. Решение с тонкопленочными транзисторами на полиамидной подложке унаследовало все возможности популярного микроконтроллера.

02.08.2021    25509    user1015646    0       

1

Новость ИТ-Новость

Представители корпорации Intel заявили, что компания начнет производство чипов Qualcomm. Также компания подготовила план развития, чтобы догнать своих конкурентов, таких как Taiwan Semiconductor Manufacturing и Samsung Electronics, к 2025 году.

30.07.2021    11427    SKravchenko    1       

1

Новость ИТ-Новость

Компания TSMC, один из крупнейших производителей микропроцессоров, разработала инновационную систему водяного охлаждения. Она позволяет отвести от чипа 2,6 кВт тепла.

30.07.2021    26691    user1015646    1       

2

Новость ИТ-Новость

Microsoft представила эмулятор ретрокомпьютера Altair 8800 на операционной системе для работы с облаком Azure Sphere.

27.07.2021    20882    SKravchenko    0       

2

Новость Windows ИТ-Новость

Энтузиасты и стартаперы полюбили Arduino и Raspberry Pi. Но инженеры Commate Computer (Commell) пошли дальше и представили миниатюрный ПК LE-37O на базе новейших чипов Intel Tiger Lake. И на нем можно запустить Windows 10.

16.07.2021    13707    user1015646    3       

1
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. starik-2005 3088 08.06.20 14:32 Сейчас в теме
Они что, выложили в открытый доступ систему команд? Аттракцион невиданной щедрости! ))))

ЗЫ: У всех производителей процессоров это в открытом доступе, иначе бы под них никто не стал бы писать софт - как его писать без документации?
2. burmsergey 17 08.06.20 17:30 Сейчас в теме
(1) В публикации неточное введение. Поэтому если прочитать только его (первые два предложения), то формируется оценка типа "аттракцион".
На самом деле по указанной ссылке расположено нечто большее: руководство по эффективному программированию на платформе «Эльбрус».
А описание системы команд занимает в нём только одну главу из 10.
4. starik-2005 3088 09.06.20 00:28 Сейчас в теме
(2)
руководство по эффективному программированию
На сайте Интела и AMD даже компиляторы для С/С++ свои выложены и очень много документации об оптимизации. Плюс библиотеки с оптимизированной математикой.

Создатели Эльбруса что-то втирали на счет того, что если все правильно написать, то компилятор может из этого сделать хорошо распаралелленый код, но мы то знаем, что не все в этом мире хорошо параллелится. Более того, распараллелится все по количеству ядер. Что там может быстрее работать, чем на других процессорах с более высокой частотой и IPC? Ну только если воткнули пару команд для шифрования ГОСТ - так это аппаратная штука, а не программная.

Ну ладно, давайте посмотрим руководство.

1. Работа с платформой.

Ну тут ассемблер и дизасемблер элементарных функций на С++ с указанием номера такта выполнения и механикой оптимизации. Так-то прикольно: в системе куча наборов регистров - 16 общих, 16 глобальных и 16 специальных.Регистров мало не бывает - это точно. Ну и оптимизация адресным выравниванием и помещение "широкой" команды в конвейер для однотактового (суперскалярного параллельного) выполнения. Что-то ноу-хау я тут не вижу - все процы давно уже так делают, а еще предсказывают ветвление и прочие штуки, иногда играющие плохую шутку с возможностью вытащить пару чужих байт (уязвимости типа спектра spectre). В общем -О0 .. -О4 - тоже нового ничего нет.
Ну или вот, банальное:
Обратите внимание, что в результате оптимизаций в режиме -O3 вызов был заменён на:
И что было заменено? Вызов процедуры на инлайн-код. Тоже ничего нового - это все было в самых древних компиляторах, полагаю.

В принципе эти все "широкие команды" - это основной признак архитектуры АРМ, суть которой была в том, что ну очень много команд на все случаи жизни? прибавил и перешел, умножил и перешел, если в результате больше/меньше/равно. Предположу, что ноги оттуда растут, но за дополнительные регистры - да, спасибо, полезно иногда...

Вообще, архитектура интересная, но память-то медленная - те же нейронки упрутся в ее производительность и кучей регистров горю не поможешь. Не увидел команд для 128-256-512 бит, может дальше будут.

2. Повышение производительности.
Один из известных ресурсов повышения производительности - выявление и использование параллелизма на уровне элементарных операций (устоявшийся термин ILP = Instruction-Level Parallelism).
Для АПП «Эльбрус» параллелизм выражается в машинном коде явным образом в виде Широких Команд (ШК), а задача обнаружения и эффективного использования ILP возлагается на компилятор
- этот принцип характерен для всех известных процессоров VLIW


VLIW также получила хорошее распространение на рынке GPU, так, видеопроцессоры AMD/ATI Radeon начиная с R600 и до Northern Islands включительно имеют VLIW-архитектуру.[8][9] Начиная с Southern Islands (первый квартал 2012) компания AMD/ATI отошла от подхода VLIW[10]


Т.е. тут у нас очень широкие команды, которые упаковываются в один процессорный такт, если не работают с памятью, которую придется ждать (если не в кеше). Но на сколько они щироки? Большинство современных процессоров суперскалярны и умеют любой код таким образом параллелить, есть такая штука, как SMT(АМД) - симуляция многопоточности на одном ядре. У Интела это называется Hyper Threading. Технология реализует на конвейере одного ядра одновременно выполняются команд разных потоков, сгруппированных специальным сложным аппаратным механизмом процессора. Для Эльбруса компилятор произведет такую оптимизацию и в некоторых случаях создаст "широкую команду", которая за такт пару-тройку инструкций, сгруппированных в этой команде, выполнит. В общем обычный софт будет работать на Эльбрусе долго и упорно, т.к. процессор неспособен ни ветвления предсказать, ни команды как-то иначе, чем это сделано в момент генерации машинного кода, сгруппировать. Именно по-этому от данной технологии в самых современных архитектурах давно отказались, т.к. сложно всем угодить и иметь в пакете код, оптимизированный для разных процессоров - пусть процессор сам его поймет и максимально хорошо выполнит.

Дальше там дана интересная таблица задержек на операциях с целыми и вещественными числами (не маленькая), выборки данных из кеша 1-3-го уровня (до 40 тактов) и чтения из памяти (в районе 100 тактов, что на 400-800 МГц весьма и весьма долго). Как я понял, никакого спекулятивного чтения из памяти, никакого предсказания ветвлений в этом процессоре нет. Все, что компилятор не оптимизирует, будет выполняться не быстро.


Основное, что нужно понять здесь, так это то, что такое этот пресловутый параллелизм. А это просто группировка команд для быстрого выполнения в широкую команду. Это та самая суперскалярность. Но если современные процессоры Intel и AMD умеют динамически перестраивать инструкции х86 в оптимальную последовательность одновременного выполнения, то Эльбрус тут без оптимизирующей компиляции "даст маху", ибо неспособен ни на что подобное. Ну и при частоте в 10 раз медленнее конкурентов даже четыре инструкции за такт будет выполняться в два с половиной раза дольше, чем одна инструкция за такт вообще никак не оптимизированного кода на Intel или AMD.
Serega-artem; akim2040; +2 Ответить
3. Perfolenta 206 08.06.20 18:52 Сейчас в теме
(1) про систему команд они давно говорили, что как только основной заказчик в лице гос.органов разрешит, так сразу и опубликуют... а до этого, несколько лет, её можно было получить по специальному запросу...
а ПО можно было давно писать на С, С++ и многих других языках, что многие и делали...
Оставьте свое сообщение