Układ scalony procesora sygnałowego na wbudowanej płytce bazowej.
Twoje rozmowy telefoniczne, strumieniowe przesyłanie wideo, muzyka strumieniowa, kamera w smartfonie i wiele innych nie działałyby zgodnie z przeznaczeniem bez układu scalonego procesora sygnałowego. W wielu nowszych systemach algorytmy, które wykonują ważne zadania przetwarzania sygnałów cyfrowych, są integrowane z SoC, uruchamiane jako oprogramowanie na wbudowanym systemie operacyjnym lub po prostu przenoszone do chmury (np. w systemach wbudowanych połączonych z chmurą). Te zadania muszą być zdefiniowane na poziomie sprzętu, oprogramowania lub obu, a wybór komponentów będzie dyktować czas obliczeń i dokładność wyników.
Obszary zastosowań takie jak 5G i edge computing odchodzą od FPGA na rzecz mocy przetwarzania w niestandardowych SoC i specjalizowanych komponentach układów scalonych procesora sygnałowego. Wzrost na tym rynku jest już prognozowany na podobnym poziomie jak rynek FPGA, dzięki łatwości programowania, większej specjalizacji i mniejszej potrzebie równoległości. Ze względu na te zmiany w krajobrazie rynkowym i wymaganiach urządzeń, warto porównać opcje układów scalonych procesora sygnałowego cyfrowego z FPGA, ponieważ mogą one wykonywać te same funkcje, ale w różny sposób i z różnymi wskaźnikami wydajności.
Oba typy komponentów mogą wykonywać operacje arytmetyczne na liczbach stałoprzecinkowych i zmiennoprzecinkowych, mają podobne rozmiary i podobny koszt za operację arytmetyczną w niektórych przypadkach. Jednak różnią się zestawem funkcji, krzywą uczenia się programowania i całkowicie różnym poziomem specjalizacji. FPGA oferują wysoko dostosowywalne programowanie, podczas gdy DSP są przeznaczone do specjalizowanych zastosowań przetwarzania sygnałów (stąd nazwa). Tylko niektóre specjalizowane FPGA z mieszanych sygnałów zawierają bloki ADC/DAC, podczas gdy większość wysokowydajnych DSP będzie zawierać bloki DAC/ADC do interfejsu z czujnikami i innymi instrumentami.
Podsumowując, gdy potrzebujesz procesora, który zapewnia wysoką dostosowalność z zasobami współdzielonymi, szybszą prędkość przetwarzania i znaczącą równoległość, będziesz miał szybsze obliczenia i niższy koszt za MAC, lepszym wyborem jest FPGA. Jednak, jeśli prędkość nie jest kluczowym czynnikiem, a potrzebujesz określonych zintegrowanych funkcji, lepiej użyć układu scalonego procesora sygnałowego. Przy niższych taktowaniach/MAC zobaczysz szybsze obliczenia przy podobnym koszcie za MAC jak w przypadku FPGA.
Układ scalony procesora sygnałowego będzie musiał współpracować z innymi komponentami za pomocą standardowych protokołów.
Istnieją pewne ważne wytyczne do rozważenia przy wyborze układu scalonego procesora sygnałowego:
Te opcje zapewniają szybsze, bardziej dokładne obliczenia w porównaniu do ich odpowiedników FPGA przy podobnych częstotliwościach zegara i podobnych kosztach. Krzywa uczenia się programowania jest również łatwiejsza dla tych komponentów, co pomaga wielu projektantom szybciej wprowadzać nowe produkty do produkcji niż w przypadku użycia FPGA.
TMS320C6720BRFP200 od Texas Instruments to niedrogi układ scalony cyfrowego procesora sygnałowego, który obsługuje obliczenia 32-bitowe stałopunktowe, 32-bitowe zmiennoprzecinkowe (pojedyncza precyzja) lub 64-bitowe zmiennoprzecinkowe (podwójna precyzja). Niektóre idealne zastosowania tego komponentu to wysokowydajne systemy audio (np. efekty w czasie rzeczywistym, syntezę dźwięku, modelowanie instrumentów, kodowanie/transmisję), obrazowanie medyczne (np. tomografia 3D i przetwarzanie obrazów), biometrię i inne aplikacje wymagające specjalistycznych zadań przetwarzania sygnałów.
Ten komponent nie zawiera bloków ADC/DAC, chociaż zawiera 2 interfejsy SPI i 2 interfejsy I2C do łączenia z zewnętrznymi komponentami ADC/DAC. Ten komponent zawiera również Uniwersalny Interfejs Portu Hosta (UHPI), gdzie zewnętrzny procesor CPU może uzyskać dostęp do pamięci na komponencie równolegle. W przeciwieństwie do niektórych innych układów scalonych cyfrowych procesorów sygnałowych, występuje pewien poziom równoległości w obliczeniach:
Przy 350 MHz, CPU jest zdolne do maksymalnej wydajności 2800 MIPS/2100 MFLOPS, wykonując do ośmiu instrukcji (z których sześć to instrukcje zmiennoprzecinkowe) równolegle w każdym cyklu. CPU natywnie obsługuje arytmetykę 32-bitową stałopunktową, 32-bitową zmiennoprzecinkową pojedynczej precyzji i 64-bitową zmiennoprzecinkową podwójnej precyzji [z karty katalogowej TMS320C6720BRFP200]
Schemat blokowy układu scalonego procesora sygnałowego TMS320C6720BRFP200. Z karty katalogowej TMS320C6720BRFP200.
ADSP-21161NCCAZ100 od Analog Devices to kolejny układ scalony procesora sygnałowego, który jest przeznaczony do zastosowań audio, wideo, medycznych i przemysłowych. Ten komponent BGA oferuje wiele zintegrowanych peryferiów, w tym 1 Mbit zintegrowanego SRAM, 16 strumieni Tx/Rx przez I2S, magistralę SPI oraz interfejs JTAG. Obsługuje formaty danych 32-bitowe stałoprzecinkowe, 32-bitowe zmiennoprzecinkowe (pojedyncza precyzja) oraz 40-bitowe zmiennoprzecinkowe (rozszerzona precyzja) z prędkością do 660 MFLOPS.
Jako algorytm oceny wydajności, ten komponent wykonuje obliczenia FFT dla 1024 punktów złożonych w zaledwie 92 μs oraz filtr impulsowy o skończonej odpowiedzi w 5 ns na próbkę (100 MHz częstotliwość instrukcji). Sprawia to, że procesor jest idealny do zastosowań w przetwarzaniu sygnałów audio i obrazu w czasie rzeczywistym. Czasy obliczeń dla ważnych algorytmów benchmarkowych są pokazane poniżej.
Wydajność ADSP-21161NCCAZ100 wobec algorytmów benchmarkowych. Z karty katalogowej ADSP-21161NCCAZ100.
66AK2E05XABDA4 układ scalony procesora sygnałowego ma wyższą cenę niż komponent TI pokazany powyżej, ale zapewnia znacznie szybszą prędkość przetwarzania i dostęp do wielu więcej peryferiów. Może również współpracować z 2 interfejsami USB 3.0 i 2 peryferiami PCIe. Zapewnia także 32x GPIO, 2x UART i 3x interfejsy SPI, a także 1 GBE i 10 GBE Ethernet. Wszystko jest zbudowane na czterordzeniowym ARM A15 z częstotliwością zegara 1,4 GHz. Pod względem możliwości przetwarzania, ten komponent zapewnia obliczenia 32-bitowe stałoprzecinkowe (38,4 GMACS/Core przy 1,2 GHz) i zmiennoprzecinkowe (19,2 GFlops/Core przy 1,2 GHz). 66AK2E05XABDA4 zawiera jeden 64-bitowy, 1,5-V interfejs DDR3 SDRAM EMIF.
Schemat blokowy układu scalonego procesora sygnałowego 66AK2E05XABDA4. Z karty katalogowej 66AK2E05XABDA4.
Kiedy szukasz układu scalonego procesora sygnałowego, znajdziesz wszystkie pokazane powyżej części i wiele innych opcji na Octopart. Znajdziesz tam również wiele opcji dla komponentów wspierających Twoją następną PCB.
Zapoznaj się z naszymi najnowszymi artykułami, zapisując się do naszego newslettera.