Автор статьи
Валерия
Эксперт по сдаче вступительных испытаний в ВУЗах
Уменьшение техпроцесса производства процессоров приводит к:
- (Правильный ответ) увеличению количества транзисторов на кристалле
- увеличению тепловыделения процессора
- (Правильный ответ) уменьшению размеров транзисторов
Современные персональные компьютеры в основном относятся к:
- (Правильный ответ) SMP системам
- кластерным системам
- MPP системам
Какой порог производительности преодолеют лидеры списка Top 500 в ближайшие годы?
- (Правильный ответ) экзафлопс
- петафлопс
- терафлопс
Информационная целостность (когерентность) кэшей может быть организована на аппаратном уровне.
- нет
- (Правильный ответ) да
Информационную целостность (когерентность) кэшей на аппаратном уровне могут обеспечить:
- (Правильный ответ) совместно используемая кэш-память
- (Правильный ответ) протоколы на основе справочника
- котики
- протокол TCP/IP
Сколько контроллеров памяти содержит сопроцессор Intel Xeon Phi?
- 1
- 4
- 2
- (Правильный ответ) 8
Блок векторных вычислений:
- (Правильный ответ) имеет конвейерную структуру
- не конвейеризован
При использовании режима Offload:
- MPI-процессы выполняются как на процессорах базовой системы, так и на сопроцессорах Intel Xeon Phi
- MPI-процессы выполняются только на сопроцессорах Intel Xeon Phi
- (Правильный ответ) MPI-процессы выполняются только на процессорах базовой системы
Какова разрядность блока векторных вычислений сопроцессора Intel Xeon Phi (длина обрабатываемых векторов)?
- 1024 бит
- 256 бит
- (Правильный ответ) 512 бит
- 128 бит
Техника двойной буферизации позволяет
- уменьшить время передачи входных/выходных данных при использовании режима Offload
- уменьшить размер необходимой памяти при использовании режима Offload
- (Правильный ответ) уменьшить или полностью компенсировать латентность передачи входных/выходных данных при использовании режима Offload
При использовании модели симметричного выполнения (Symmetric model)
- MPI-процессы выполняются только на сопроцессорах Intel Xeon Phi
- (Правильный ответ) MPI-процессы выполняются как на процессорах базовой системы, так и на сопроцессорах Intel Xeon Phi
- MPI-процессы выполняются только на процессорах базовой системы
Сколько потоков может одновременно выполняться на сопроцессоре Intel Xeon Phi?
- (Правильный ответ) 244
- 60
- 240
- 61
Сколько конвейеров содержит одно ядро сопроцессора Intel Xeon Phi?
- 1
- 8
- 4
- (Правильный ответ) 2
Можно ли при использовании режима Offload выполнять в Offload-части кода вызовы MPI-функций?
- можно, для этого существует специальный механизм
- (Правильный ответ) нельзя
Какие дополнительные возможности реализованы в сопроцессоре Intel Xeon Phi по сравнению с процессорами Xeon?
- увеличен размер векторных регистров
- (Правильный ответ) расширен набор команд AVX
- (Правильный ответ) реализованы инструкции, которые позволяют упаковывать в векторы для обработки данные, произвольно расположенные в памяти
- (Правильный ответ) реализованы специальные регистры масок, использование которых позволяет осуществлять условное выполнение операций над элементами векторов
Можно ли при использовании режима Offload организовать передачу между хостом и сопроцессором сложных структур данных, например, использующих указатели?
- (Правильный ответ) можно, для этого существует специальный механизм
- нельзя
Какие характеристики имеют кеши L1 (кеш инструкций L1 I-Cache и кеш данных L1 D-Cache) ядра сопроцессора Intel Xeon Phi?
- (Правильный ответ) размер — 32 Кб, размер строки — 64 байта, степень ассоциативности — 8
- размер — 32 Кб, размер строки — 32 байта, степень ассоциативности — 4
- размер — 32 Кб, размер строки — 64 байта, степень ассоциативности — 4
- размер — 64 Кб, размер строки — 64 байта, степень ассоциативности — 8
Какова латентность доступа к памяти сопроцессора Intel Xeon Phi?
- примерно 400 тактов
- (Правильный ответ) примерно 300 тактов
- примерно 100 тактов
- примерно 200 тактов
- исполнения только на сопроцессоре
- offload
- (Правильный ответ) симметричном
Для создания параллельной области необходимо использовать директиву:
- #pragma omp for
- (Правильный ответ) #pragma omp parallel
- #pragma parallel
- #pragma omp
Пусть разработан код представленный ниже:
#pragma offload target(mic:0) wait (s1) { F1(p1, p2); } F2(); В каком порядке будут исполняться функции F1 и F2?- асинхронно F1 и F2
- (Правильный ответ) вначале F1, затем F2
- вначале F2, затем F1
Какой из представленных ниже скриптов обеспечивает запуск программы в симметричном режиме:
- #!/bin/shmpiexec.hydra –perhost 1 ./program_name
- (Правильный ответ) #!/bin/shmpiexec.hydra –hosts 2 node0 node1 –n 2 –perhost 1 ./program_name: \–hosts 4 mic0 mic1 mic2 mic3 –n 4 –perhost 1 ./program_name.mic
- #!/bin/shmpiexec.hydra –host mic0 –n 1 –perhost 1 ./program_name.mic
Для каких вычислительных систем предназначена технология OpenMP?
- для систем с распределенной памятью
- (Правильный ответ) для систем с общей памятью
Какая директива OpenMP может быть использована для синхронизации потоков?
- #pragma omp waitall
- #pragma omp wait
- (Правильный ответ) #pragma omp barrier
Какой из представленных ниже скриптов обеспечивает запуск программы в режиме offload:
- (Правильный ответ) #!/bin/shmpiexec.hydra –perhost 1 ./program_name
- #!/bin/shmpiexec.hydra –hosts 2 node0 node1 –n 2 –perhost 1 ./program_name: \–hosts 4 mic0 mic1 mic2 mic3 –n 4 –perhost 1 ./program_name.mic
- #!/bin/shmpiexec.hydra –host mic0 –n 1 –perhost 1 ./program_name.mic
В программе на MPI необходимо распределить итерации цикла между процессами, считая, что время выполнения итераций примерно одинаковое
- (Правильный ответ) разделить общее число итераций цикла на число процессов. По рангу каждого процесса определить начальное и конечное значение счетчика цикла.
- это будет сделано автоматически по общему число процессов
- вызвать MPI-функцию, которая для каждого процесса определит, какие итерации цикла должен выполнить данный процесс
Какой скрипт обеспечивает получение монопольного доступа к двум узлам кластера, на каждом из которых установлено не менее двух сопроцессоров? Работа ведется на кластере с системой управления SLURM.
- #!/bin/sh sbatch –N 2 –-gres=mic:2
- (Правильный ответ) #!/bin/shsalloc –N 2 —gres=mic:2
- #!/bin/shsbatch –N 2 –-gres=mic:1
- #!/bin/shsalloc –N 1 —gres=mic:2
Пусть разработан код представленный ниже:
F1(); #pragma offload target(mic:0) signal(s1) { F2(p1, p2); } В каком порядке будут исполняться функции F1 и F2?- вначале F2, затем F1
- асинхронно F1 и F2
- (Правильный ответ) вначале F1, затем F2
Сколько потоков для вычислений будет создано библиотекой TBB после выполнения указанного ниже кода?
task_scheduler_init init; init.initialize(4);- будет создан 1 поток
- будет создано 4 потока
- (Правильный ответ) количество создаваемых потоков будет определено автоматически
- потоки созданы не будут из-за ошибки повторной инициализации
Пусть разработан код представленный ниже:
F1(); #pragma offload target(mic:0) wait(s1) { F2(p1, p2); } В каком порядке будут исполняться функции F1 и F2?- вначале F2, затем F1
- асинхронно F1 и F2
- (Правильный ответ) вначале F1, затем F2
Процессы параллельной программой в рамках MPI:
- обязательно выполняются на одном процессоре
- (Правильный ответ) могут выполняться на разных процессорах, на одном процессоре могут располагаться несколько процессов
- могут выполняться только на разных процессорах
- (Правильный ответ) offload
- симметричном
- исполнения только на сопроцессоре
Размер векторного регистра для хранения данных с плавающей запятой в наборе команд Intel Xeon Phi составляет:
- 16 байт
- 8 байт
- (Правильный ответ) 64 байт
- 32 байт
Как реализована расширенная поддержка математических функций в Xeon Phi?
- (Правильный ответ) 4 математические функции реализованы аппаратно для одинарной точности
- основные математические функции вычисляются без потери точности
- основные математические функции вычисляются аппаратно
- основные математические функции реализованы аппаратно для одинарной точности
Пусть в программе присутствует следующий код:
#define LOOP_SIZE 30…int rr[LOOP_SIZE];…p = 1;for(int k = 0; k < LOOP_SIZE; k++){ p *= rr[k];} Возможна ли векторизация данного цикла средствами компилятора, для исполнения на Intel Xeon Phi?- (Правильный ответ) векторизация возможна для части цикла
- нет, длина цикла мала
- нет, между итерациями есть зависимость
Размер векторного регистра для хранения данных с плавающей запятой в наборе команд AVX составляет:
- 8 байт
- 64 байт
- 16 байт
- (Правильный ответ) 32 байт
Какого потенциального ускорения можно добиться при векторизации функции, работающей с вещественными числами одинарной точности, с использованием расширения SSE на процессоре Intel Xeon
- 8 раз
- 2 раза
- (Правильный ответ) 4 раза
- 16 раз
Код «D[:] = sin(S[:]);» в Cilk Plus приведёт к:
- ошибке компиляции
- инверсии операций
- потере времени
- (Правильный ответ) векторизации
В системе доступно 3 сопроцессора. Директива #pragma offload target(mic:5) обеспечивает:
- (Правильный ответ) выполнение следующего за ней блока кода на сопроцессоре 2
- выполнение следующего за ней блока кода на сопроцессоре 1
- приводит к ошибке времени исполнения
- выполнение следующего за ней блока кода на сопроцессоре 0
Выберите синтаксическую конструкцию, которая бы обеспечивала запуск участка кода на сопроцессоре (язык C/C++):
- __attribute__((target(mic)))
- #pragma offload_attribute
- #pragma offload_transfer
- (Правильный ответ) #pragma offload
Какая из предложенных ниже синтаксических конструкций говорит компилятору о том, все массивы в рамках цикла выровнены?
- __assume(n1%16==0)
- __declspec(align(64)) или __attribute__((aligned(64)))
- (Правильный ответ) #pragma vector aligned
- __assume_aligned(A, 64)
- _mm_malloc(bufsize, 64)
К чему приводит неравномерное распределение вычислительной нагрузки между потоками?
- к ошибкам в процессе вычислений
- (Правильный ответ) к неэффективной работе программы
- к нехватке памяти
Отметьте некорректное утверждение касательно правил вызова элементарных функций (технология Elemental Functions):
- (Правильный ответ) передача структур по ссылке запрещена
- непрямые вызовы запрещены
- передача структур по значению запрещена
- синхронизация запрещена
Выберите синтаксические конструкции, посредством которых выделяются те участки кода, которые должны быть скомпилированы для выполнения на сопроцессоре:
- #pragma offload_attribute
- #pragma offload_transfer
- __attribute__((target(mic)))
- (Правильный ответ) #pragma offload
При использовании директивы #pragma offload с параметром in для каких данных поддерживается копирование?
- для структур с полями любых типов
- (Правильный ответ) для статических массивов с элементами встроенных типов данных
- (Правильный ответ) для скалярных переменных всех встроенных типов данных
Какая директива предназначена для того, чтобы сообщить компилятору об отсутствии зависимостей в цикле?
- #pragma omp
- #pragma simd
- (Правильный ответ) #pragma ivdep
- #pragma vector aligned
Пусть в программе присутствует следующий код:
#define LOOP_SIZE 130…int rr[LOOP_SIZE];for(int k = 0; k < LOOP_SIZE; k++){ rr[k] = number % k;} Возможна ли векторизация данного цикла средствами компилятора, для исполнения на Intel Xeon Phi?- нет, длина цикла мала
- (Правильный ответ) векторизация возможна для части цикла
- нет, между итерациями есть зависимость
- нет, длина цикла не кратна 2
Отметьте некорректные выражения с точки зрения использования технологии Array Notation:
- (Правильный ответ) a[0:5] = b[0:6];
- a[0:4] = 5;
- a[0:4] = b[i];
- (Правильный ответ) b[i] = a[0:4];
Технология Elemental Functions в Intel Cilk Plus используется для
- упрощения кода
- (Правильный ответ) векторизации кода
- распараллеливания кода
Размер векторного регистра для хранения данных с плавающей запятой в наборах команд SSE составляет:
- 8 байт
- 32 байт
- (Правильный ответ) 16 байт
- 64 байт
О сайте
Поделитесь в соцсетях: