ShenWei

ShenWei (кит. 申威) — семейство микропроцессоров, разработанных китайской компанией Jiāngnán Computing Lab (кит. 江南计算技术研究所) из Уси.


Гибридный микропроцессор ShenWei SW26010[ | ]

Летом 2016 года была опубликована информация о процессорах ShenWei SW26010, на базе которых был создан наиболее производительный суперкомпьютер в мире (по рейтингу TOP500), Sunway TaihuLight. Каждый процессор содержит 4 управляющих RISC-ядра и 256 вычислительных RISC-ядер общего назначения в 4 группах по 64 ядра[1].

Микропроцессор ShenWei SW1600[ | ]

ShenWei SW1600 — третье поколение процессоров компании Jiāngnán Computing Research Lab. Работая на тактовой частоте 1,1 ГГц, он достигает производительности на операциях с плавающей запятой в 140,8 Гфлопс. Содержит 16 ядер архитектуры RISC. Создан в рамках совместного проекта Jiāngnán Computing Research Lab и «High Performance Server & Storage Technologies» (кит. 高效能服务器和存储技术). Изготовлен по технологии 65 нм. Производится в Шанхае, предположительно, компанией SMIC, S2 fab.

Характеристики ядра SW1600:

  • суперскалярный процессор с исполнением до 4 инструкций за такт;
  • исполнительные устройства: два целочисленных, два для обработки чисел с плавающей запятой;
  • целочисленный конвейер имеет 7 стадий, а конвейер чисел с плавающей запятой — 10 стадий;
  • виртуальная адресация 43-битная, физическая адресация 40-битная;
    • Поддерживается виртуальное адресное пространство размером до 8 ТБ, физическое — 1 ТБ;
  • кеш L1: 8 КБ для инструкций, 8 КБ для данных;
  • кеш L2: 96 КБ, универсальный;
  • 128-битная системная шина.[2]

История процессоров ShenWei[ | ]

Серия процессоров ShenWei разрабатывалась в основном для военных применений в КНР. Есть мнение, что оригинальная архитектура основывалась на некоторых идеях процессоров DEC Alpha.[3] По другой версии, использовались некоторые идеи архитектуры SPARC.

ShenWei SW-1[ | ]

  • первое поколение ShenWei, 2006 год;
  • кристалл содержит одно ядро;
  • тактовая частота — 900 МГц;
  • техпроцесс — 130 нм, SMIC.

ShenWei SW-2[ | ]

  • второе поколение ShenWei, 2008 год;
  • кристалл содержит два ядра;
  • тактовая частота — 1,4 ГГц;
  • техпроцесс — 130 нм, SMIC;
  • тепловыделение — до 70-100 Вт.

ShenWei SW-3[ | ]

  • третье поколение ShenWei, 2010 год;
  • 64-битная архитектура;
  • 16-ядерный чип[4];
  • тактовая частота — 975—1200 МГц;
  • техпроцесс — 65 нм;
  • общая[уточнить] производительность чипа при вычислениях с плавающей запятой — 140,8 GFLOPS на частоте 1,1 ГГц;
    • производительность одного ядра — 8 операций над числами с плавающей запятой за 1 такт[5];
  • контроллер оперативной памяти:
    • максимальный объем — 16 ГБ;
    • пиковая пропускная способность — 68 ГБ/с;
    • четыре канала;
    • 128-битный DDR3.

Sunway SW26010[ | ]

см. SW26010

  • Четвёртое поколение, 2016;
  • 64-битная архитектура;
  • тактовая частота — 1,45 ГГц;
  • 260-ядерный чип, состоящий из 4 кластеров, в каждом из которых размещаются по 64 «вычислительно-процессинговых элемента» (Compute-Processing Elements, CPE), расположенных в виде матрицы 8 на 8 элементов, и одного управляющего процессингового элемента» (Management Processing Element, MPE), который обеспечивает наблюдательные функции, соединённые между собой посредством сети-на-кристалле (англ.)

Суперкомпьютер Sunway BlueLight MPP[ | ]

Sunway BlueLight MPP
Активность с сентября 2011 года
Операторы Технологический департамент Программы 863
Местонахождение Национальный суперкомпьютерный центр, Цзинань, кит. 国家超算济南中心
Архитектура 8575 процессоров SW1600 (975 МГц)
Мощность ~1 МВт
Пространство 2 ПБ
Оперативная память 150 ТБ
Производительность 1,07 петафлопс (сентябрь 2011 года)
Рэнкинг TOP500: 14 (ноябрь 2011)[6]
TOP100 Китая: 2 (2011)[7]
Green500 39 (2011)[8]

Массово-параллельный суперкомпьютер Sunway BlueLight (кит. 神威蓝光) полностью разработан в КНР и использует микропроцессоры SW1600 (SW-3). Является первым китайским суперкомпьютером с производительностью петафлопсного диапазона, изготовленным на базе разработанных в Китае микропроцессоров.[9][10] Занимает 14 место в рейтинге TOP500 суперкомпьютеров в мире (ноябрь 2011)[6] , 2 место в рейтинге Top100 суперкомпьютеров КНР 2011 года[7][11] и 39 место в рейтинге Green500 (11/2011).[8] Комплекс введен в строй в сентябре 2011 года и установлен в Национальном суперкомпьютерном центре в Цзинане. Разработан в National Parallel Computer Engineering Technology Research Center (кит. 国家并行计算机工程技术研究中心) и эксплуатируется Технологическим департаментом Программы 863.

Состоит конструктивно из 9 стоек, 8704 процессоров ShenWei SW1600 (975 МГц[7]), сгруппированных в 34 суперузла (Super Nodes). Каждый суперузел состоит из 256 вычислительных узлов. В стойке — 4 суперузла. В каждом RackUnit установлено 4 процессорные платы, по 2 процессора на каждой.[12][13]

Общий объём оперативной памяти 150 ТБ, внешней памяти 2 ПБ. Пиковая производительность при использовании 8575 процессоров на частоте 975 МГц составила 1,07016 Пфлопс, производительность на тесте LINPACK - 795,9 Тфлопс (эффективность 74,37 %).[7] Энергопотребление 1074 кВт (1 МВт). Использует исключительно водяное охлаждение.[14]

Сетевая подсистема построена на базе InfiniBand QDR, топология Fat tree. Используются оптические кабели и коммутаторы на 256 и 324 порта. Пропускная способность каждого соединения 80 Гбит/с, суммарная — 8,7 Тбит/с; латентность порядка 2 мкс.

Суперкомпьютер Sunway TaihuLight[ | ]

SW26010 применяются в суперкомпьютере Sunway TaihuLight, который на ноябрь 2016 года занимал 1 место по производительности в рейтинге TOP500. В Sunway TaihuLight используется 40 960 процессоров SW26010, производительность в тесте LINPACK достигает 93,01 PFLOPS.

Примечания[ | ]

  1. Jack Dongarra. Report on the Sunway TaihuLight. Tech Report UT-EECS-16-742 (англ.). — University of Tennessee, June 24, 2016.
  2. Hung-Sheng Tsao. SW1600 и Alpha 21164 (недоступная ссылка). LaoTsao's Weblog (29 октября 2011). Дата обращения: 29 октября 2011. Архивировано 2 сентября 2012 года.
  3. hswz. Jiangnan Computing Lab's Civilian CPU Debut - SW-1 (недоступная ссылка). bbs.lemote.com (4 мая 2009). Дата обращения: 31 октября 2011. Архивировано 31 марта 2012 года.
  4. http://www.prace-project.eu/IMG/pdf/d8.4_1ip.pdf Архивная копия от 27 сентября 2016 на Wayback Machine page 42
  5. Andreas Stiller, About TLAs and IPOs Архивировано 19 августа 2012 года. // TOP500 whispers, 2012-02-15: "Currently, 8 flops/clock/core – Sandy Bridge, Power7, SPARC, VIII8fx, Bluegene/Q, ShenWei "
  6. 1 2 http://top500.org/list/2011/11/100 TOP500 List — November 2011 (1-100)
  7. 1 2 3 4 洪钊峰. 2011 China HPC Top100 Ranking (недоступная ссылка). it168 (27 октября 2011). Дата обращения: 30 октября 2011. Архивировано 25 октября 2012 года.
  8. 1 2 http://www.green500.org/lists/2011/11/top/list.php?from=1&to=100 Архивная копия от 23 ноября 2011 на Wayback Machine The Green500 List — November 2011
  9. JOHN MARKOFF, The New York Times. «China Has Homemade Supercomputer Gain.» October 28, 2011. Retrieved November 7, 2011.
  10. Cade Metz, WIRED. «China Builds World-Class Supercomputer Sans Intel, AMD.» October 31, 2011. Retrieved November 7, 2011.
  11. アーカイブされたコピー (недоступная ссылка). Дата обращения: 18 ноября 2011. Архивировано 11 сентября 2012 года. 2011年中国高性能计算机性能TOP100排行榜
  12. SUNWAY BlueLight MPP 神威蓝光
  13. HPCwire: China’s Indigenous Supercomputing Strategy Bears First Fruit
  14. xiongxuehui. 国产CPU再掀热潮 揭秘神威蓝光来龙去脉 (недоступная ссылка). pconline (29 октября 2011). Дата обращения: 29 октября 2011. Архивировано 14 мая 2012 года.

Ссылки[ | ]