Opcje układów scalonych procesorów sygnałowych dla zastosowań wbudowanych

Utworzono: kwiecień 17, 2020
Zaktualizowano: lipiec 1, 2024
Układ scalony procesora sygnałowego

Układ scalony procesora sygnałowego na wbudowanej płytce bazowej.

Twoje rozmowy telefoniczne, strumieniowe przesyłanie wideo, muzyka strumieniowa, kamera w smartfonie i wiele innych nie działałyby zgodnie z przeznaczeniem bez układu scalonego procesora sygnałowego. W wielu nowszych systemach algorytmy, które wykonują ważne zadania przetwarzania sygnałów cyfrowych, są integrowane z SoC, uruchamiane jako oprogramowanie na wbudowanym systemie operacyjnym lub po prostu przenoszone do chmury (np. w systemach wbudowanych połączonych z chmurą). Te zadania muszą być zdefiniowane na poziomie sprzętu, oprogramowania lub obu, a wybór komponentów będzie dyktować czas obliczeń i dokładność wyników.

Układy scalone procesora sygnałowego cyfrowego vs. FPGA

Obszary zastosowań takie jak 5G i edge computing odchodzą od FPGA na rzecz mocy przetwarzania w niestandardowych SoC i specjalizowanych komponentach układów scalonych procesora sygnałowego. Wzrost na tym rynku jest już prognozowany na podobnym poziomie jak rynek FPGA, dzięki łatwości programowania, większej specjalizacji i mniejszej potrzebie równoległości. Ze względu na te zmiany w krajobrazie rynkowym i wymaganiach urządzeń, warto porównać opcje układów scalonych procesora sygnałowego cyfrowego z FPGA, ponieważ mogą one wykonywać te same funkcje, ale w różny sposób i z różnymi wskaźnikami wydajności.

Oba typy komponentów mogą wykonywać operacje arytmetyczne na liczbach stałoprzecinkowych i zmiennoprzecinkowych, mają podobne rozmiary i podobny koszt za operację arytmetyczną w niektórych przypadkach. Jednak różnią się zestawem funkcji, krzywą uczenia się programowania i całkowicie różnym poziomem specjalizacji. FPGA oferują wysoko dostosowywalne programowanie, podczas gdy DSP są przeznaczone do specjalizowanych zastosowań przetwarzania sygnałów (stąd nazwa). Tylko niektóre specjalizowane FPGA z mieszanych sygnałów zawierają bloki ADC/DAC, podczas gdy większość wysokowydajnych DSP będzie zawierać bloki DAC/ADC do interfejsu z czujnikami i innymi instrumentami.

Podsumowując, gdy potrzebujesz procesora, który zapewnia wysoką dostosowalność z zasobami współdzielonymi, szybszą prędkość przetwarzania i znaczącą równoległość, będziesz miał szybsze obliczenia i niższy koszt za MAC, lepszym wyborem jest FPGA. Jednak, jeśli prędkość nie jest kluczowym czynnikiem, a potrzebujesz określonych zintegrowanych funkcji, lepiej użyć układu scalonego procesora sygnałowego. Przy niższych taktowaniach/MAC zobaczysz szybsze obliczenia przy podobnym koszcie za MAC jak w przypadku FPGA.

Układ scalony procesora sygnałowego na płytce bazowej

Układ scalony procesora sygnałowego będzie musiał współpracować z innymi komponentami za pomocą standardowych protokołów.

Wskaźniki wydajności układów scalonych procesora sygnałowego cyfrowego

Istnieją pewne ważne wytyczne do rozważenia przy wyborze układu scalonego procesora sygnałowego:

  • Wskaźnik mnożenia-akumulacji (MAC): Jest to związane z poniższym punktem, ale zależy również od głębokości bitowej dla operacji stałopunktowych lub zmiennoprzecinkowych. Jest to główne kryterium oceny wydajności układu cyfrowego procesora sygnałowego.
  • Częstotliwość zegara/instrukcji: Częstotliwości instrukcji są zazwyczaj mierzone w MIPS (milionach instrukcji na sekundę) lub jako wartość czasu cyklu.
  • Wydajność w stosunku do algorytmów wzorcowych: Specyficzne pomiary czasów obliczeń dla algorytmów wzorcowych dają punkt odniesienia, z którym można porównać własne algorytmy. Dwa powszechne algorytmy wzorcowe to filtracja o skończonej odpowiedzi impulsowej i FFT.
  • Dostęp do zintegrowanych peryferiów: Te układy scalone zwykle oferują wiele programowalnych wejść/wyjść i interfejsów w jednej obudowie do łączenia z innymi komponentami. Zwróć uwagę na dostępne protokoły sygnalizacyjne w swoim układzie scalonym.
  • Koszt: jedną z zalet tych komponentów jest ich wyższa wydajność dla zadań przetwarzania sygnałów przy niższym koszcie w porównaniu do porównywalnych MCU lub FPGA (patrz wyżej). Często nie ma dużej przewagi w kupowaniu więcej, chyba że potrzebujesz dostępu do większej liczby zewnętrznych peryferiów lub interfejsów.

Opcje układów scalonych cyfrowych procesorów sygnałowych o wysokiej wydajności

Te opcje zapewniają szybsze, bardziej dokładne obliczenia w porównaniu do ich odpowiedników FPGA przy podobnych częstotliwościach zegara i podobnych kosztach. Krzywa uczenia się programowania jest również łatwiejsza dla tych komponentów, co pomaga wielu projektantom szybciej wprowadzać nowe produkty do produkcji niż w przypadku użycia FPGA.

Texas Instruments, TMS320C6720BRFP200

TMS320C6720BRFP200 od Texas Instruments to niedrogi układ scalony cyfrowego procesora sygnałowego, który obsługuje obliczenia 32-bitowe stałopunktowe, 32-bitowe zmiennoprzecinkowe (pojedyncza precyzja) lub 64-bitowe zmiennoprzecinkowe (podwójna precyzja). Niektóre idealne zastosowania tego komponentu to wysokowydajne systemy audio (np. efekty w czasie rzeczywistym, syntezę dźwięku, modelowanie instrumentów, kodowanie/transmisję), obrazowanie medyczne (np. tomografia 3D i przetwarzanie obrazów), biometrię i inne aplikacje wymagające specjalistycznych zadań przetwarzania sygnałów.

Ten komponent nie zawiera bloków ADC/DAC, chociaż zawiera 2 interfejsy SPI i 2 interfejsy I2C do łączenia z zewnętrznymi komponentami ADC/DAC. Ten komponent zawiera również Uniwersalny Interfejs Portu Hosta (UHPI), gdzie zewnętrzny procesor CPU może uzyskać dostęp do pamięci na komponencie równolegle. W przeciwieństwie do niektórych innych układów scalonych cyfrowych procesorów sygnałowych, występuje pewien poziom równoległości w obliczeniach:

Przy 350 MHz, CPU jest zdolne do maksymalnej wydajności 2800 MIPS/2100 MFLOPS, wykonując do ośmiu instrukcji (z których sześć to instrukcje zmiennoprzecinkowe) równolegle w każdym cyklu. CPU natywnie obsługuje arytmetykę 32-bitową stałopunktową, 32-bitową zmiennoprzecinkową pojedynczej precyzji i 64-bitową zmiennoprzecinkową podwójnej precyzji [z karty katalogowej TMS320C6720BRFP200]

Schemat blokowy układu scalonego procesora sygnałowego TMS320C6720BRFP200

Schemat blokowy układu scalonego procesora sygnałowego TMS320C6720BRFP200. Z karty katalogowej TMS320C6720BRFP200.

Analog Devices, ADSP-21161NCCAZ100

ADSP-21161NCCAZ100 od Analog Devices to kolejny układ scalony procesora sygnałowego, który jest przeznaczony do zastosowań audio, wideo, medycznych i przemysłowych. Ten komponent BGA oferuje wiele zintegrowanych peryferiów, w tym 1 Mbit zintegrowanego SRAM, 16 strumieni Tx/Rx przez I2S, magistralę SPI oraz interfejs JTAG. Obsługuje formaty danych 32-bitowe stałoprzecinkowe, 32-bitowe zmiennoprzecinkowe (pojedyncza precyzja) oraz 40-bitowe zmiennoprzecinkowe (rozszerzona precyzja) z prędkością do 660 MFLOPS.

Jako algorytm oceny wydajności, ten komponent wykonuje obliczenia FFT dla 1024 punktów złożonych w zaledwie 92 μs oraz filtr impulsowy o skończonej odpowiedzi w 5 ns na próbkę (100 MHz częstotliwość instrukcji). Sprawia to, że procesor jest idealny do zastosowań w przetwarzaniu sygnałów audio i obrazu w czasie rzeczywistym. Czasy obliczeń dla ważnych algorytmów benchmarkowych są pokazane poniżej.

Wydajność ADSP-21161NCCAZ100 wobec algorytmów benchmarkowych

Wydajność ADSP-21161NCCAZ100 wobec algorytmów benchmarkowych. Z karty katalogowej ADSP-21161NCCAZ100.

Texas Instruments, 66AK2E05XABDA4

66AK2E05XABDA4 układ scalony procesora sygnałowego ma wyższą cenę niż komponent TI pokazany powyżej, ale zapewnia znacznie szybszą prędkość przetwarzania i dostęp do wielu więcej peryferiów. Może również współpracować z 2 interfejsami USB 3.0 i 2 peryferiami PCIe. Zapewnia także 32x GPIO, 2x UART i 3x interfejsy SPI, a także 1 GBE i 10 GBE Ethernet. Wszystko jest zbudowane na czterordzeniowym ARM A15 z częstotliwością zegara 1,4 GHz. Pod względem możliwości przetwarzania, ten komponent zapewnia obliczenia 32-bitowe stałoprzecinkowe (38,4 GMACS/Core przy 1,2 GHz) i zmiennoprzecinkowe (19,2 GFlops/Core przy 1,2 GHz). 66AK2E05XABDA4 zawiera jeden 64-bitowy, 1,5-V interfejs DDR3 SDRAM EMIF.

Schemat blokowy układu scalonego procesora sygnałowego 66AK2E05XABDA4

Schemat blokowy układu scalonego procesora sygnałowego 66AK2E05XABDA4. Z karty katalogowej 66AK2E05XABDA4.

Kiedy szukasz układu scalonego procesora sygnałowego, znajdziesz wszystkie pokazane powyżej części i wiele innych opcji na Octopart. Znajdziesz tam również wiele opcji dla komponentów wspierających Twoją następną PCB.

Zapoznaj się z naszymi najnowszymi artykułami, zapisując się do naszego newslettera.

Powiązane zasoby

Powrót do strony głównej
Thank you, you are now subscribed to updates.