На секцию высокопроизводительных вычислительных систем будут приниматься научные работы, посвященные проблемам и методам проектирования отечественных универсальных микропроцессоров и вычислительных комплексов, их аппаратуры и системного программного обеспечения. Основное внимание уделяется высокой производительности и защищенности вычислительного процесса, двоичной совместимости с доступными ресурсами прикладного программного обеспечения.
Рабочий язык: русский
Формат проведения: онлайн
Дата проведения: 4 апреля 2023г. в 11:00 часов
При RTL-моделировании недоступны функции ОС. Следовательно необходима программная прослойка, которая эмулирует часть функций ОС для корректного исполненния тестовых программ на RTL
В рамках данной работы, в составе оптимизирующего компилятора LCC было реализовано инструментирование оптимизации overlap. Данное инструментирование позволяет найти проблемы в циклах при работе пользовательской программы и получить отчёт с подсказками, которые программист может расставить в помощь компилятору. Демонстрация работы была произведена на задаче 523.xalancbmk. В результате работы инструментирования удалось ускорить задачу на 38%.
В данной работе рассматривается подход к повышению производительности подсистемы памяти путем уменьшения частоты промахов в кэш-память последнего уровня. Это достигается за счет увеличения эффективного объема кэш-памяти при использовании аппаратной компрессии данных.
Разрабатывается методика переиспользования пространства кэш-памяти, освободившегося за счет компрессии данных. Приведены результаты, демонстрирующие прирост производительности на примере некоторых задач пакета SPEC CPU2000.
В рамках данной работы была разработана новая оптимизация в составе компилятора LCC, нацеленная на ускорение работы программы путем устранения повторного вычисления самых частых значений математических функций. Применение оптимизации позволило получить ускорение задачи 544.nab пакета SPEC CPU 2017r на 5.8%.
Работа посвящена портированию системы сборки GNU Autotools+make и фреймворка тестирования DejaGnu в режим безопасных вычислений "Эльбрус"
В работе описаны предпосылки, цели и особенности реализации модулей аппаратной поддержки криптографической защиты информации в вычислительных ядрах новых микропроцессоров "Эльбрус"
В рамках данной работы была разработана новая функция в составе библиотеки EML, реализующая алгоритм Винограда быстрого умножения матриц. Были рассмотрены оптимизации данного алгоритма. Ускорение по сравнению с классическим умножением матриц составляет 8%, начиная с матриц 4000х4000
В рамках данной работы был разработан JIT-компилятор classic BPF для архитектуры Эльбрус в ядре ОС Эльбрус. Результаты измерений показали увеличение скорости фильтрации сетевых пакетов в 9,4 раза.
Кэши играют важную роль в процессорах, снижая фактическое время доступа в память и уменьшая поток обращений в неё. В многоядерных процессорах основной кэш обычно делают общим, для упрощения проектирования разделяя его на число банков, равное числу ядер. В некоторых процессорах количество ядер, и соответственно банков кэша, не является степенью двойки. В таких случаях необходим алгоритм, позволяющий эффективно использовать кэш с произвольным количеством банков.
Был разработан модуль ядра Linux для диагностики систем на базе микропроцессоров "Эльбрус". Оптимизирован существующий алгоритм подсчета частоты каналов памяти, решены проблемы с безопасностью и стандартизацией.
В рамках данной работы была разработана оптимизация выноса раннего выхода из функции в компиляторе lcc и исследована её применимость.
Исследование, реализация и оптимизация буфера адресов переходов BTB для микропроцессора МЦСТ-R 2000+