

Instytut Podstawowych Problemów Techniki Polska Akademia Nauk

Praca doktorska

# Ultrasonografia kodowana: transmisja i kompresja w czasie rzeczywistym

Marcin Lewandowski

Promotor: Prof. dr hab. inż. Andrzej Nowicki

2009

#### Copyright © 2009 Marcin Lewandowski. Wszelkie prawa zastrzeżone.

#### Znaki towarowe

Wszystkie znaki firmowe, znaki logo i inne zastrzeżone nazwy, stanowiące własność poszczególnych firm i instytucji, zostały użyte wyłącznie w celach informacyjnych.

#### Kontakt

strona WEB autora: http://www.marcinlewandowski.org email autora: mlew@ippt.gov.pl

# Spis treści

| St | Streszczenie 7  |                                                             |    |  |  |  |
|----|-----------------|-------------------------------------------------------------|----|--|--|--|
| Po | Podziękowania 9 |                                                             |    |  |  |  |
| Sp | pis rysunków 11 |                                                             |    |  |  |  |
| Sp | is tal          | bel                                                         | 15 |  |  |  |
| 1  | Wst             | éb                                                          | 17 |  |  |  |
|    | 1.1             | Temat pracy                                                 | 17 |  |  |  |
|    | 1.2             | Cel pracy                                                   | 19 |  |  |  |
|    | 1.3             | Ultrasonografia wysokiej częstotliwości                     | 20 |  |  |  |
|    |                 | 1.3.1 Ograniczenia poziomów nadawania                       | 21 |  |  |  |
|    |                 | 1.3.2 Zastosowania                                          | 23 |  |  |  |
|    |                 | 1.3.3 Podsumowanie                                          | 29 |  |  |  |
| 2  | Tra             | nsmisja kodowana                                            | 31 |  |  |  |
|    | 2.1             | Sygnały kodowane                                            | 31 |  |  |  |
|    |                 | 2.1.1 Rodzaje kodów                                         | 32 |  |  |  |
|    |                 | 2.1.2 Filtracja dopasowana                                  | 37 |  |  |  |
|    | 2.2             | Sygnały kodowane w ultrasonografii                          | 38 |  |  |  |
|    |                 | 2.2.1 Aspekty techniczne                                    | 40 |  |  |  |
|    |                 | 2.2.2 Wpływ pasma głowicy na sygnały kodowane               | 42 |  |  |  |
|    |                 | 2.2.3 Rozkłady pola dla pobudzeń kodowanych                 | 42 |  |  |  |
|    |                 | 2.2.4 Podsumowanie                                          | 44 |  |  |  |
| 3  | Ukł             | ady i systemy cyfrowego przetwarzania sygnałów              | 47 |  |  |  |
|    | 3.1             | Systemy cyfrowego przetwarzania sygnałów                    | 47 |  |  |  |
|    |                 | 3.1.1 Programowalne układy logiczne                         | 49 |  |  |  |
|    |                 | 3.1.2 Procesory sygnałowe                                   | 56 |  |  |  |
|    |                 | 3.1.3 Procesory uniwersalne                                 | 60 |  |  |  |
|    |                 | 3.1.4 Procesory graficzne                                   | 63 |  |  |  |
|    | 3.2             | Układy przetwarzania analogowo-cyfrowego                    | 68 |  |  |  |
|    |                 | 3.2.1 Zasada działania przetworników A/C                    | 69 |  |  |  |
|    |                 | 3.2.2 Architektura przetworników A/C                        | 70 |  |  |  |
|    |                 | 3.2.3 Specyfikacja przetworników A/C                        | 71 |  |  |  |
|    |                 | 3.2.4 Pomiary układów przetworników                         | 76 |  |  |  |
|    | 3.3             | Budowa ultrasonografu                                       | 78 |  |  |  |
|    |                 | 3.3.1 Tor przetwarzania sygnału w ultrasonografii obrazowej | 78 |  |  |  |

|   |             | 3.3.2    Technologie cyfrowe w polskich aparatach    7       | 9        |
|---|-------------|--------------------------------------------------------------|----------|
| 4 | Pro         | ekt systemu 8                                                | 3        |
|   | 4.1         | Architektura systemu                                         | 3        |
|   |             | 4.1.1 Tor przetwarzania ultrasonografu z transmisją kodowaną | 3        |
|   |             | 4.1.2 Analiza rozwiązań                                      | 4        |
|   | 4.2         | Moduł kodera-digitizera                                      | 7        |
|   |             | 4.2.1 Przetwornik analogowo-cyfrowy                          | 7        |
|   |             | 4.2.2 Przetworniki cyfrowo-analogowe                         | 0        |
|   |             | 4.2.3 Układ FPGA                                             | 0        |
|   |             | 4.2.4 Układ zegara                                           | 3        |
|   |             | 4.2.5 Interfeis USB                                          | 3        |
|   |             | 4.2.6 Zasilanie modułu                                       | 5        |
|   | 4.3         | Analogowe układy wej./wyj                                    | 5        |
|   | 1.0         | 4.3.1 Wzmacniacz mocy 9                                      | 5        |
|   |             | 4.3.2 Wzmacniacz odbiorczy 9                                 | 5        |
|   | <u> </u>    | Ilkłady zasilania                                            | 6        |
|   | 1.1<br>4.5  | Panel regulacyiny                                            | 6        |
|   | 4.5         | 4.5.1 Budowa papolu                                          | 6        |
|   | 16          | 4.5.1 Dudowa panenu                                          | 0        |
|   | 4.0         | Goowica ultradzwiękowa                                       | 0        |
|   |             | 4.0.1 Pizetwornik utradzwiękowy                              | 0        |
|   | 4 7         | 4.6.2 Geoffietria giowicy                                    | 9        |
|   | 4.7         | Oprogramowanie sterujące i przetwarzające                    | 9        |
|   |             | 4.7.1 Architektura strumieniowa 10                           | 0        |
|   |             | 4.7.2 Przetwarzanie cyfrowe CPU                              | 1        |
|   |             | 4.7.3 Przetwarzanie cyfrowe GPU                              | 4        |
|   |             | 4.7.4 Oprogramowanie użytkowe                                | 1        |
|   | 4.8         | Podsumowanie                                                 | 3        |
| 5 | Wyr         | ki 11                                                        | 5        |
|   | 5.1         | Testy modułu                                                 | 5        |
|   |             | 5.1.1 Komunikacja moduł ↔ komputer PC                        | 5        |
|   |             | 5.1.2 Parametry systemu akwizycji                            | 6        |
|   |             | 5.1.3 Weryfikacja w pętli elektrycznej                       | 7        |
|   |             | 5.1.4 Sygnały od reflektora w wodzie                         | 9        |
|   |             | 5.1.5 Geometria systemu obrazującego 11                      | 9        |
|   |             | 5.1.6 Testy oprogramowania przetwarzania i wizualizacji      | 21       |
|   | 5.2         | Porównanie kodów                                             | 2        |
|   |             | 5.2.1 Rozdzielczość podłużna i stosunek sygnał-szum          | 2        |
|   |             | 5.2.2 Badania <i>in vivo</i> $\ldots$ 12                     | 2        |
|   | 5.3         | Zastosowania kliniczne                                       | 25       |
|   |             | 5.3.1 Badania cellulitu                                      | 25       |
|   |             | 5.3.2 Pomiary grubości kompleksu intima-media                | 26       |
| ß | Dod         | umowanje 10                                                  | 0        |
| U | 6 1         | Systemy elektroniczne 12                                     | <b>J</b> |
|   | 0.1         | Systemy practivergenie 12                                    | .9<br>00 |
|   | 0.2         | Dopskudovno i impo oplikacio graterati     13                | U.       |
|   | <b>b.</b> 3 | Kozbudowa i inne aplikacje systemu                           | 1        |

|    |                 | 6.3.1   | Rozbudowa systemu                                           | 132 |  |
|----|-----------------|---------|-------------------------------------------------------------|-----|--|
|    |                 | 6.3.2   | Inne aplikacje                                              | 133 |  |
|    |                 | 6.3.3   | Perspektywy rozwoju ultrasonografii wysokiej częstotliwości | 134 |  |
|    | 6.4             | Możli   | wości komercjalizacji ultrasonografu                        | 134 |  |
|    |                 | 6.4.1   | Zintegrowane głowice USB                                    | 135 |  |
|    |                 | 6.4.2   | Optymalizacja systemu                                       | 135 |  |
| A  | Sch             | emat io | leowy systemu                                               | 137 |  |
| B  | Ory             | ginaln  | e osiągnięcia autora                                        | 153 |  |
| Bi | ibliografia 155 |         |                                                             |     |  |

# Streszczenie

Techniki ultradźwiękowe posiadają inherentne ograniczenie wiążące rozdzielczość i głębokość obrazowania. Wzrost rozdzielczości wymaga zwiększenia częstotliwości fali, co automatycznie powoduje zwiększenie tłumienia i ograniczenie zakresu obrazowania. Dla zastosowań wymagających dużej rozdzielczości (dermatologia, oftalmologia) stosowana jest ultrasonografia wysokiej częstotliwości w zakresie 20–50 MHz, a głębokość obrazowania ograniczona jest do 3– 7 mm. Metoda transmisji kodowanej, polegająca na transmisji długich sygnałów nadawczych charakteryzujących się szczególną funkcją autokorelacji, pozwala na złamanie tego ograniczenia. Zwiększenie całkowitej energii sygnału nadawanego przez jego wydłużenie, bez zwiększania szczytowego ciśnienia (ograniczonego względami bezpieczeństwa) pozwala poprawić stosunek sygnał-szum oraz zwiększyć głębokość obrazowania.

Celem pracy było opracowanie i budowa modelu ultrasonografu wysokiej częstotliwości z transmisją kodowaną. Główną motywacją opracowania było uzyskanie obrazowania w czasie rzeczywistym umożliwiającego badanie różnych typów przebiegów kodowanych w warunkach laboratoryjnych oraz klinicznych. W ramach pracy został opracowany moduł elektroniczny kodera-digitizera realizujący funkcje arbitralnego generatora nadawczych sygnałów kodowanych oraz digitizera odbieranych ech ultradźwiękowych. Moduł zrealizowano w oparciu o najnowocześniejsze układy elektroniczne, zapewniając częstotliwości próbkowania 200 MHz i transfer do komputera PC cyfrowych sygnałów ech w.cz. przez interfejs USB w czasie rzeczywistym. Autor zrealizował w pełni softwarowy strumieniowy algorytm cyfrowego przetwarzania sygnału w.cz. ech. Dzięki zaproponowanej zbalansowanej architekturze przetwarzania, polegającej na podziale zadań obliczeniowych pomiędzy procesor główny komputera i procesor graficzny, całość przetwarzania i wizualizacji odbywa się w czasie rzeczywistym na komputerze PC z prędkością do 10 obrazów/s. W pracy przedstawiono wyniki eksperymentalne dla różnych typów pobudzeń kodowanych (chirp, kody Barkera, kody Golaya) oraz porównano je z klasycznymi pobudzeniami krótkim impulsem.

Zastosowanie transmisji kodowanej znacząco poprawiło jakość obrazu dzięki zwiększeniu stosunku sygnał-szum. Umożliwiło także zwiększenie rozdzielczości (częstotliwości ultradźwiękowej) przy zachowaniu głębokości obrazowania (z 20 do 35 MHz).

Opracowany system ultrasonografu dzięki niewielkim rozmiarom oraz wykorzystaniu notebooka jest w pełni przenośny. Uniwersalność i łatwość modyfikacji algorytmów przetwarzania predysponują go także do innych aplikacji akwizycji i przetwarzania sygnałów. System pozwoli na realizację dalszych badań porównawczych oraz optymalizację sygnałów kodowanych. Ponadto praktyczny system z przetwarzaniem i wizualizacją w czasie rzeczywistym daje możliwość ewaluacji i badań przez lekarzy, co jak wiadomo jest elementem koniecznym dla sprzętu do diagnostyki medycznej.

# Podziękowania

Serdeczne podziękowania dla:

- Profesora Andrzeja Nowickiego za cierpliwość i wiarę.
- Bogusława Zienkiewicza za bycie wzorem inżyniera.
- Ryszarda Tymkiewicza za dotknięcie ręką tam gdzie trzeba.
- Ziemowitowi Klimondzie za górę zjedzonych wspólnie ciastek.
- Przyjaciół z Florencji profesora Piero Tortoli oraz Stefano Ricci za pomoc i dyskusję.
- WSZYSTKICH pracowników Zakładu Ultradźwięków za wsparcie.
- Małgorzaty i Julki za korektę pracy.

# Spis rysunków

| 1.1 | Budowa skóry (źródło: Wikipedia/www.3dscience.com): 1) por, 2) warstwa ro-<br>gowa naskórka, 3) warstwa ziarnista naskórka, 4) warstwa kolczasta naskórka,<br>5) skóra właściwa, 6) ciałka Ruffiniego, 7) gruczoł potowy, 8) ciałka Paciniego,<br>9) włókna nerwowe, 10) mięsień nastraszający włosa, 11) włókna mięśniowe,<br>12) tętnica, 13) żyła, 14) cebulka włosa, 15) korzeń włosa, 16) gruczoł łojowy,<br>17) ciałko Meissnera, 18) trzon włosa                                                                                                                                                                                                                     | 24 |
|-----|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----|
| 1.2 | Budowa oka (źródło: Wikipedia/Chabacano): 1) komora tylna, 2) rąbek zęba-<br>ty, 3) mięsień rzęskowy, 4) obwódka rzęskowa, 5) kanał Schlemma, 6) źrenica,<br>7) przednia komora, 8) rogówka, 9) tęczówka, 10) kora soczewki, 11) jądro so-<br>czewki, 12) ciałko rzęskowe, 13) spojówka, 14) mięsień skośny dolny, 15) mięsień<br>prosty dolny, 16) mięsień prosty przyśrodkowy, 17) naczynia siatkówki, 18) tarcza<br>nerwu wzrokowego, 19) opona twarda, 20) tętnica środkowa siatkówki, 21) żyła<br>środkowa siatkówki, 22) nerw wzrokowy, 23) żyła wirowata, 24) otoczka, 25) plam-<br>ka żółta, 26) dołek środkowy, 27) twardówka, 28) naczyniówka, 29) mięsień prosty |    |
|     | górny                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       | 27 |
| 2.1 | Związek długości impulsu z jego spektrum amplitudowym (na podstawie [75]) .                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 32 |
| 2.2 | Zależności czasu i częstotliwości dla sygnału chirp o rosnącej (lewy) i malejącej (prawy) częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 34 |
| 2.3 | 7-bitowy kod Barkera oraz modulowany nim fazowo sygnał sinusoidalny (na pod-<br>stawie [75])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 35 |
| 2.4 | Algorytm kompresji kodów Golaya                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             | 36 |
| 2.5 | Układ 4-bitowego rejestru LFSR — generatora ciągu MLS o długości 15                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         | 38 |
| 2.6 | Schemat blokowy układu bezpośredniej syntezy cyfrowej DDS (na podstawie [8])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 41 |
| 2.7 | Schemat systemu do pomiaru rozkładów pól przetworników ultradźwiękowych .                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | 43 |
| 2.8 | Rozkłady pól ciśnienia dla różnych pobudzeń kodowanych                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 45 |
| 3.1 | Uproszczona architektura układu FPGA z rodziny Spartan-3 firmy Xilinx                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       | 50 |
| 3.2 | Metodologia projektowania układów FPGA (na podstawie [147])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 53 |
| 3.3 | Wydajność bloków DSP układów Xilinx oraz ich aplikacje [152]                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 57 |
| 3.4 | Budowa jądra procesora sygnałowego z rodziny C64+ firmy Texas Instruments (na podstawie [140])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              | 59 |
| 3.5 | Potok przetwarzania 3D (na podstawie [76])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 64 |
| 3.6 | Implementacja GPU potoku przetwarzania 3D (na podstawie [46])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               | 66 |
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             |    |

| 3.7                                                                                                                                                                        | Architektura procesora graficznego NVIDIA GeForce 8800: M1–8 — multiproce-                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                                                                                                                                                                                                                            |
|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|                                                                                                                                                                            | sor, P — jednostka skalarna, T — jednostka teksturowania, L1 — pamięć pod-                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | ręczna pierwszego poziomu, L2 – pamięć podręczna drugiego poziomu, FB –                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | interfejs do pamięci, ROP — jednostka operacji rastrowych (na podstawie [107])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | 67                                                                                                                                                                                                                         |
| 3.8                                                                                                                                                                        | Porównanie wydajności procesorów GPU i CPU [3]                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | 68                                                                                                                                                                                                                         |
| 3.9                                                                                                                                                                        | Funkcja konwersji idealnego 3-bitowego przetwornika A/C (kodowanie binarne                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | unipolarne)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               | 69                                                                                                                                                                                                                         |
| 3.10                                                                                                                                                                       | 2ródła zniekształceń i szumu w układzie przetwornika A/C (na podstawie [68]) .                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | 70                                                                                                                                                                                                                         |
| 3.11                                                                                                                                                                       | Budowa przetwornika potokowego na przykładzie 14-bitowego przetwornika A/C firmy Texas Instruments ADS5474 [139]: A1–3 — wzmacniacze, TH1–3 — układy                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | ślędzaco-próbkujące ADC1–3 — przetworniki A/C DAC1–2 — przetworniki C/A                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | 71                                                                                                                                                                                                                         |
| 3 12                                                                                                                                                                       | 2 Zniekształcenia i błedy przetworników A/C (na podstawie [18])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | 74                                                                                                                                                                                                                         |
| 3 13                                                                                                                                                                       | Definicia parametrów dynamicznych na przykładowym widmie FFT (8192 punk-                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | • •                                                                                                                                                                                                                        |
| 0.10                                                                                                                                                                       | tów) dla czestotliwości wejściowej $f_{in} = 10 \text{ kHz}$ : A — sygnał podstawowy. B —                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | pierwsza harmoniczna, C — druga harmoniczna, D — SFDR, E — SINAD, F —                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | średni poziom szumów (na podstawie [18])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 75                                                                                                                                                                                                                         |
| 3.14                                                                                                                                                                       | Definicia jittera apertury próbkowania przetwornika A/C (na podstawie [68]) .                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             | 75                                                                                                                                                                                                                         |
| 3.15                                                                                                                                                                       | Zależność efektywnej liczby bitów przetwornika A/C od jittera apertury oraz cze-                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | stotliwości próbkowanego sygnału (na podstawie [68])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 77                                                                                                                                                                                                                         |
| 3.16                                                                                                                                                                       | Dvnamika widma 4096 punktowego FFT dla idealnego 12-bitowego przetworni-                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |                                                                                                                                                                                                                            |
|                                                                                                                                                                            | ka A/C (na podstawie [68])                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 78                                                                                                                                                                                                                         |
| 3.17                                                                                                                                                                       | Schemat blokowy toru obrazowego ultrasonografu z analogowym demodulatorem                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 79                                                                                                                                                                                                                         |
| 3.18                                                                                                                                                                       | Schemat blokowy toru obrazowego ultrasonografu z cyfrowym demodulatorem                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | 80                                                                                                                                                                                                                         |
|                                                                                                                                                                            | solicinal blokowy tora obrazowego ana solicopiana z cynowym achiotalatorem.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |                                                                                                                                                                                                                            |
| 4.1                                                                                                                                                                        | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 84                                                                                                                                                                                                                         |
| 4.1<br>4.2                                                                                                                                                                 | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną<br>Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         | 84<br>85                                                                                                                                                                                                                   |
| <ul><li>4.1</li><li>4.2</li><li>4.3</li></ul>                                                                                                                              | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną<br>Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną<br>Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 84<br>85                                                                                                                                                                                                                   |
| 4.1<br>4.2<br>4.3                                                                                                                                                          | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną<br>Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną<br>Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-<br>dzinie czasu i częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 84<br>85<br>86                                                                                                                                                                                                             |
| <ul> <li>4.1</li> <li>4.2</li> <li>4.3</li> <li>4.4</li> </ul>                                                                                                             | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną<br>Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną<br>Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-<br>dzinie czasu i częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 84<br>85<br>86<br>88                                                                                                                                                                                                       |
| <ul> <li>4.1</li> <li>4.2</li> <li>4.3</li> <li>4.4</li> <li>4.5</li> </ul>                                                                                                | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną<br>Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną<br>Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-<br>dzinie czasu i częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 84<br>85<br>86<br>88<br>88                                                                                                                                                                                                 |
| <ul> <li>4.1</li> <li>4.2</li> <li>4.3</li> <li>4.4</li> <li>4.5</li> <li>4.6</li> </ul>                                                                                   | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną<br>Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną<br>Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-<br>dzinie czasu i częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 84<br>85<br>86<br>88<br>88<br>88                                                                                                                                                                                           |
| <ul> <li>4.1</li> <li>4.2</li> <li>4.3</li> <li>4.4</li> <li>4.5</li> <li>4.6</li> <li>4.7</li> </ul>                                                                      | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 84<br>85<br>86<br>88<br>88<br>89<br>89                                                                                                                                                                                     |
| <ul> <li>4.1</li> <li>4.2</li> <li>4.3</li> <li>4.4</li> <li>4.5</li> <li>4.6</li> <li>4.7</li> <li>4.8</li> </ul>                                                         | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 84<br>85<br>86<br>88<br>88<br>89<br>89<br>90                                                                                                                                                                               |
| <ul> <li>4.1</li> <li>4.2</li> <li>4.3</li> <li>4.4</li> <li>4.5</li> <li>4.6</li> <li>4.7</li> <li>4.8</li> <li>4.9</li> </ul>                                            | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 84<br>85<br>86<br>88<br>88<br>89<br>89<br>90<br>92                                                                                                                                                                         |
| 4.1<br>4.2<br>4.3<br>4.4<br>4.5<br>4.6<br>4.7<br>4.8<br>4.9<br>4.10                                                                                                        | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]                                                                                                                                                                                                                                                                                                                                                                                                                                            | 84<br>85<br>86<br>88<br>88<br>89<br>89<br>90<br>92<br>95                                                                                                                                                                   |
| 4.1<br>4.2<br>4.3<br>4.4<br>4.5<br>4.6<br>4.7<br>4.8<br>4.9<br>4.10<br>4.11                                                                                                | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwości                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 84<br>85<br>86<br>88<br>89<br>89<br>90<br>92<br>95<br>96                                                                                                                                                                   |
| 4.1<br>4.2<br>4.3<br>4.4<br>4.5<br>4.6<br>4.7<br>4.8<br>4.9<br>4.10<br>4.11<br>4.12                                                                                        | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]Schemat blokowy układów zasilania mikrosonografuWidok panelu regulacyjnego USB                                                                                                                                                                                                                                                                                                                                                              | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> </ul>                                                                                         |
| 4.1<br>4.2<br>4.3<br>4.4<br>4.5<br>4.6<br>4.7<br>4.8<br>4.9<br>4.10<br>4.11<br>4.12<br>4.13                                                                                | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną         Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną         Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-         dzinie czasu i częstotliwości .         Schemat blokowy modułu kodera-digitizera         Widok zmontowanej płytki modułu kodera-digitizera         Schemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81] .         Zalecany układ wejściowy przetwornika MAX1215 [81] .         Zależności czasowe próbkowania dla przetwornika MAX1215 [81] .         Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]         Schemat blokowy układów zasilania mikrosonografu .         Widok panelu regulacyjnego USB .                                                                                                                                                                                                                                               | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> </ul>                                                                             |
| 4.1<br>4.2<br>4.3<br>4.4<br>4.5<br>4.6<br>4.7<br>4.8<br>4.9<br>4.10<br>4.11<br>4.12<br>4.13<br>4.14                                                                        | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]Schemat blokowy układów zasilania mikrosonografuWidok panelu regulacyjnego USBSchemat blokowy panelu regulacyjnego mikrosonografu                                                                                                                                                                                                                                                                                                           | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> </ul>                                                                 |
| $\begin{array}{c} 4.1 \\ 4.2 \\ 4.3 \\ 4.4 \\ 4.5 \\ 4.6 \\ 4.7 \\ 4.8 \\ 4.9 \\ 4.10 \\ 4.11 \\ 4.12 \\ 4.13 \\ 4.14 \\ 4.15 \end{array}$                                 | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]Schemat blokowy układów zasilania mikrosonografuWidok panelu regulacyjnego USBSchemat blokowy panelu regulacyjnego mikrosonografuWidok przetwornika zamocowanego w głowicyOdpowiedź impulsowa przetwornika na 20 MHz                                                                                                                                                                                                                        | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> <li>99</li> </ul>                                                     |
| $\begin{array}{c} 4.1 \\ 4.2 \\ 4.3 \\ 4.4 \\ 4.5 \\ 4.6 \\ 4.7 \\ 4.8 \\ 4.9 \\ 4.10 \\ 4.11 \\ 4.12 \\ 4.13 \\ 4.14 \\ 4.15 \\ 4.16 \end{array}$                         | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną         Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną         Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-         dzinie czasu i częstotliwości         Schemat blokowy modułu kodera-digitizera         Widok zmontowanej płytki modułu kodera-digitizera         Schemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]         Zalecany układ wejściowy przetwornika MAX1215 [81]         Zależności czasowe próbkowania dla przetwornika MAX1215 [81]         Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]         Schemat blokowy układów zasilania mikrosonografu         Widok panelu regulacyjnego USB         Schemat blokowy panelu regulacyjnego mikrosonografu         Widok przetwornika zamocowanego w głowicy         Odpowiedź impulsowa przetwornika na 20 MHz         Kąt pomiędzy kolejnymi liniami sektora dla danego numeru linii (sygnału z en-    | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> <li>99</li> </ul>                                                     |
| $\begin{array}{c} 4.1 \\ 4.2 \\ 4.3 \\ 4.4 \\ 4.5 \\ 4.6 \\ 4.7 \\ 4.8 \\ 4.9 \\ 4.10 \\ 4.11 \\ 4.12 \\ 4.13 \\ 4.14 \\ 4.15 \\ 4.16 \end{array}$                         | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną         Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną         Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-         dzinie czasu i częstotliwości         Schemat blokowy modułu kodera-digitizera         Schemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]         Zalecany układ wejściowy przetwornika MAX1215 [81]         Zależności czasowe próbkowania dla przetwornika MAX1215 [81]         Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]         Schemat blokowy układów zasilania mikrosonografu         Widok panelu regulacyjnego USB         Schemat blokowy panelu regulacyjnego mikrosonografu         Widok przetwornika zamocowanego w głowicy         Odpowiedź impulsowa przetwornika na 20 MHz         Kąt pomiędzy kolejnymi liniami sektora dla danego numeru linii (sygnału z enkodera)                                                             | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> <li>99</li> <li>100</li> </ul>                                        |
| $\begin{array}{c} 4.1 \\ 4.2 \\ 4.3 \\ 4.4 \\ 4.5 \\ 4.6 \\ 4.7 \\ 4.8 \\ 4.9 \\ 4.10 \\ 4.11 \\ 4.12 \\ 4.13 \\ 4.14 \\ 4.15 \\ 4.16 \\ 4.17 \end{array}$                 | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwości .Schemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]Schemat modułów VHDL projektu układu FPGASchemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]Schemat blokowy panelu regulacyjnego mikrosonografuWidok przetwornika zamocowanego w głowicyOdpowiedź impulsowa przetwornika na 20 MHzKąt pomiędzy kolejnymi liniami sektora dla danego numeru linii (sygnału z enkodera)Architektura oprogramowania PC                                                                                                                                          | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> <li>99</li> <li>100</li> <li>101</li> </ul>                           |
| $\begin{array}{c} 4.1 \\ 4.2 \\ 4.3 \\ 4.4 \\ 4.5 \\ 4.6 \\ 4.7 \\ 4.8 \\ 4.9 \\ 4.10 \\ 4.11 \\ 4.12 \\ 4.13 \\ 4.14 \\ 4.15 \\ 4.16 \\ 4.17 \\ 4.18 \end{array}$         | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwości .Schemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81] .Zalecany układ wejściowy przetwornika MAX1215 [81] .Zależności czasowe próbkowania dla przetwornika MAX1215 [81] .Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]Schemat blokowy układów zasilania mikrosonografu .Widok panelu regulacyjnego USB .Schemat blokowy panelu regulacyjnego mikrosonografu .Widok przetwornika zamocowanego w głowicy .Odpowiedź impulsowa przetwornika na 20 MHz .Kąt pomiędzy kolejnymi liniami sektora dla danego numeru linii (sygnału z en-kodera) .Architektura oprogramowania PC .Przetwarzanie softwarowe sygnału w.cz.                                          | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> <li>99</li> <li>100</li> <li>101</li> <li>102</li> </ul>              |
| $\begin{array}{c} 4.1 \\ 4.2 \\ 4.3 \\ 4.4 \\ 4.5 \\ 4.6 \\ 4.7 \\ 4.8 \\ 4.9 \\ 4.10 \\ 4.11 \\ 4.12 \\ 4.13 \\ 4.14 \\ 4.15 \\ 4.16 \\ 4.17 \\ 4.18 \\ 4.19 \end{array}$ | Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowanąSchemat blokowy opracowanego systemu ultrasonografu z transmisją kodowanąPorównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dzie-dzinie czasu i częstotliwościSchemat blokowy modułu kodera-digitizeraWidok zmontowanej płytki modułu kodera-digitizeraSchemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]Zalecany układ wejściowy przetwornika MAX1215 [81]Zależności czasowe próbkowania dla przetwornika MAX1215 [81]Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]Schemat blokowy układów zasilania mikrosonografuWidok panelu regulacyjnego USBSchemat blokowy panelu regulacyjnego mikrosonografuWidok przetwornika zamocowanego w głowicyOdpowiedź impulsowa przetwornika na 20 MHzKąt pomiędzy kolejnymi liniami sektora dla danego numeru linii (sygnału z en-<br>kodera)Architektura oprogramowania PCPrzetwarzanie softwarowe sygnału w.cz.Algorytm kompresji kodów Golaya w dziedzinie częstotliwości | <ul> <li>84</li> <li>85</li> <li>86</li> <li>88</li> <li>89</li> <li>90</li> <li>92</li> <li>95</li> <li>96</li> <li>97</li> <li>97</li> <li>98</li> <li>99</li> <li>100</li> <li>101</li> <li>102</li> <li>102</li> </ul> |

| 4.21 | Zmodyfikowany algorytm kompresji kodów Golaya i detekcji obwiedni w dziedzi-<br>nie czestotliwości                                                                                                                            | 103 |
|------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----|
| 4 22 | Tworzenie svonału analitycznego dla svonału rzeczywistego                                                                                                                                                                     | 104 |
| 4.23 | Potok przetwarzania i przepływu danych w procesorze GPU (na podstawie [56])                                                                                                                                                   | 101 |
| 4.24 | Zasada działania scan-convertera                                                                                                                                                                                              | 106 |
| 4.25 | Widok sektora z obrazem testowym dla: (po lewej) interpolacji do najbliższego sasjada (po prawej) interpolacji bilinjowej                                                                                                     | 106 |
| 4 26 | Geometria i oznaczenia do interpolacii biliniowej                                                                                                                                                                             | 107 |
| 4 27 | Tor wyświetlania z buforem ramki "liniowym w jasności"                                                                                                                                                                        | 110 |
| 4 28 | Tor wyświetlania z buforem ramki "liniowym w pateżeniu"                                                                                                                                                                       | 111 |
| 4.29 | Widok głównego okna kontrolnego aplikacji mikrosonografu: A–L opis w tekście                                                                                                                                                  | 112 |
| 5.1  | Weryfikacja systemu w pętli elektrycznej dla 16-bitowych kodów Golay na 20 MHz: a) sygnał nadawczy kod A, b) sygnał nadawczy kod B, c) skompresowany odebrany kod A, d) skompresowany odebrany kod B, e) suma skompresowanych |     |
| 5.2  | kodów A i B, f) obwiednia sumy skompresowanych kodów A i B Eksperymentalne sygnały ech od reflektora w wodzie: a) sygnał nadawczy 1 okres sinusoidy na 20 MHz, b) obwiednia sygnału echa, c) widmo mocy sygnału nadaw-        | 118 |
| 5.3  | czego, d) widmo mocy odebranego echa<br>Eksperymentalne sygnały ech od reflektora w wodzie: a) sygnał nadawczy 16-<br>bitowy kod Golaya 20 MHz (jeden z pary), b) odebrany sygnał echa od reflektora,                         | 119 |
|      | c) widmo mocy sygnału nadawczego, d) widmo mocy odebranego echa, e) skom-                                                                                                                                                     |     |
| 5.4  | presowany sygnał echa, f) obwiednia skompresowanego sygnału echa Porównanie stosunku sygnał-szum dla kodów fazowych przy częstotliwości                                                                                       | 120 |
|      | 20 MHz w wodzie i ośrodku tłumiącym (agar)                                                                                                                                                                                    | 123 |
| 5.5  | Porównanie rozdzielczości dla kodów fazowych przy częstotliwości 20 MHz w wo-                                                                                                                                                 |     |
|      | dzie i ośrodku tłumiącym (agar)                                                                                                                                                                                               | 123 |
| 5.6  | Obrazy w prezentacji B — przekrój podłużny naczynia w nadgarstku; rozmiar pio-<br>nowy obrazu 7,6 mm, proporcje obrazu 1:1                                                                                                    | 124 |
| 5.7  | Obraz skóry z poprzedniego modelu mikrosonografu z 2000 r. Podziałka co 1 mm.<br>Zaznaczone warstwy skóry: E – paskórek D – skóra właściwa S – tkanka pod-                                                                    |     |
|      | skórna                                                                                                                                                                                                                        | 125 |
| 5.8  | Cellulit 4 stopień. Przed kuracją (górny) — czerwone strzałki pokazują wrastanie<br>tkanki podskórnej w skórę, zielona strzałka pokazuje niewielki obrzęk. Po kuracji                                                         | 123 |
| 5.9  | (dolny) — brak wrastania tkanki podskórnej w skórę właściwą, nie widać obrzęku<br>Przekrój podłużny naczynia w dłoni. Średnica naczynia w środkowej części                                                                    | 127 |
|      | ok. 1,1 mm, widoczna przy krawędzi naczynia warstwa intima-media wynosi ok. 0,13 mm                                                                                                                                           | 127 |
| 6.1  | Widok kompletnego systemu mikrosonografu                                                                                                                                                                                      | 130 |
| A.1  | Schemat ideowy modułu kodera-digitizera — układ interfejsu USB                                                                                                                                                                | 139 |
| A.2  | Schemat ideowy modułu kodera-digitizera — układ FPGA                                                                                                                                                                          | 141 |
| A.3  | Schemat ideowy modułu kodera-digitizera — układ przetwornika A/C                                                                                                                                                              | 143 |
| A.4  | Schemat ideowy modułu kodera-digitizera — układ przetwornika C/A                                                                                                                                                              | 145 |
| A.5  | Schemat ideowy modułu kodera-digitizera — układy zasilania                                                                                                                                                                    | 147 |
| A.6  | Schemat ideowy wzmacniacza mocy nadajnika (autor: Bogusław Zienkiewicz)                                                                                                                                                       | 149 |
| A.7  | Schemat ideowy wzmacniacza odbiorczego (autor: Ryszard Tymkiewicz)                                                                                                                                                            | 151 |

# Spis tabel

| 1.1 | Rodzaje i modele indeksu termicznego                                                                                             | 23  |
|-----|----------------------------------------------------------------------------------------------------------------------------------|-----|
| 1.2 | Rozmiary struktur skóry [141]                                                                                                    | 25  |
| 2.1 | Charakterystyka kompresji czasowej dla wybranych okien amplitudowych [58, 19]                                                    | 34  |
| 2.2 | Kody Barkera [75]                                                                                                                | 35  |
| 3.1 | Parametry wybranych układów z rodziny Xilinx Spartan3 [149]                                                                      | 51  |
| 4.1 | Wykorzystanie zasobów FPGA w projekcie kodera-digitizera                                                                         | 93  |
| 5.1 | Parametry FFT do obliczeń ENOB przetwornika A/C                                                                                  | 116 |
| 5.2 | Prędkość przetwarzania i wyświetlania (liczba obrazów/s)                                                                         | 121 |
| 5.3 | Porównanie rozdzielczości i stosunku sygnał-szum dla kodów fazowych przy czę-<br>stotliwości 20 MHz w wodzie i ośrodku tłumiącym | 122 |

## **Rozdział 1**

# Wstęp

Rozwój ultrasonografii i metod ultradźwiękowych w medycynie liczy sobie niespełna 50 lat i jest ściśle związany z rozwojem elektroniki [136]. Techniki ultradźwiękowe wyrosły bezpośrednio z techniki radarowej i sonarowej, których rozwój nastąpił w czasie wojny w związku z zastosowaniami militarnymi. Pierwsze komercyjne ultradźwiękowe urządzenia obrazujące z manualnie poruszanymi głowicami na pantografach pojawiły się w latach 1960. Następne dziesięciolecie przyniosło obrazowanie w czasie rzeczywistym przy pomocy głowic sektorowych oraz obrazowanie w skali szarości. Początek lat 1980, to początek epoki głowic wieloelementowych ze skanowaniem elektronicznym, dalsza miniaturyzacja i integracja z coraz szybciej rozwijającą się techniką cyfrową. Postęp techniki cyfrowej, a w szczególności komputerów, umożliwił pod koniec lat 1990 realizacje ultrasonografii wolumetrycznej (tzw. 3D i 4D) polegającej na rekonstrukcji obrazów trójwymiarowych. Ultrasonografia jest obecnie najpowszechniej stosowaną diagnostyczną techniką obrazową współczesnej medycyny (wyłączając klasyczne zdjęcia rentgenowskie). Ten niewatpliwy sukces ultrasonografia odniosła m.in. dzieki łatwości badania, obrazowaniu w czasie rzeczywistym oraz możliwości częstego stosowania (brak efektów biologicznych). Należy zaznaczyć, że obecny status ultrasonografii nie byłby możliwy bez rozwoju elektroniki oraz metod i systemów cyfrowego przetwarzania sygnałów, które umożliwiły nie tylko miniaturyzację urządzeń, ale przede wszystkim pozwoliły na stosowanie zaawansowanych metod kondycjonowania i przetwarzania sygnałów.

W kolejnych dwóch podrozdziałach (1.1, 1.2) przedstawiono motywację, temat i cel pracy. Ostatnia część rozdziału (1.3) stanowi wprowadzenie do zastosowań obrazowych ultradźwiękowej techniki wysokiej częstotliwości, związanych bezpośrednio z tematem pracy.

## 1.1 Temat pracy

W Zakładzie Ultradźwięków IPPT PAN w latach 1990–2000 realizowany był temat ultrasonografii wysokiej częstotliwości, w ramach którego powstał prototyp ultrasonografu na częstotliwość 20 MHz (autor tej pracy był twórcą oprogramowania tego aparatu). Mikrosonograf, tak brzmiała nazwa tego urządzenia, umożliwiał obrazowanie w czasie rzeczywistym z prędkością ok. 3 obrazów/s i dysponował zasięgiem do 5 mm. Urządzenie znalazło zastosowanie w badaniach skóry i oka. W latach 1998–2000 za jego pomocą w Instytucie Onkologii w Warszawie były prowadzone badania nowotworów złośliwych skóry (w szczególności czerniaka). Niestety rozdzielczość i jakość uzyskiwanych obrazów okazała się wtedy niewystarczająca do tego zastosowania. Ograniczony zasięg oraz słaba dynamika obrazu dla głębiej położonych warstw skóry uniemożliwiała jednoznaczną klasyfikację zmian nowotworowych.

W ostatnich latach w IPPT były prowadzone badania teoretyczne i laboratoryjne nowej techniki transmisji kodowanej w zastosowaniach ultradźwiekowych [103, 143]. Badano przydatność sygnałów kodowanych zarówno w zakresie niskich czestotliwości (do 0.5 MHz) do badań kości [102, 72], jak i w zakresie wysokich czestotliwości (20-30 MHz) do zastosowań obrazowych. Stosowane i porównywane były różne rodzaje sygnałów kodowanych: sygnały z liniową modulacją częstotliwości (chirp) oraz modulowane fazowo (kody algebraiczne Barkera, Golaya). Dane były zbierane przy pomocy układu laboratoryjnego oraz przetwarzane off-line, co uniemożliwiało uzyskanie obrazowania w czasie rzeczywistym. Otrzymane wyniki ilościowe jednoznacznie wykazały korzyści stosowania transmisji kodowanej. Zaobserwowano znaczącą poprawę stosunku sygnał-szum przy zachowaniu rozdzielczości podłużnej (dla kodów Golaya) lub niewielkim jej pogorszeniu (dla sygnałów chirp). Przykładowo, dla głowicy o czestotliwości 3,5 MHz i 16-bitowych kodów Golaya uzyskano prawie 16 dB zysk stosunku sygnał-szum w porównaniu do pobudzenia klasycznego dwoma okresami sinusoidy [143]. Podobne rezultaty dla kodów Golaya uzyskano dla głowicy o częstotliwości 0,5 MHz, stosowanej do oceny osteoporozy metoda szerokopasmowej estymacji tłumienia [102]. W tej samej pracy określono zysk stosunku sygnał-szum dla sygnału chirp o czasie trwania 16µs i paśmie 0,4–1 MHz na poziomie 12 dB.

Podobnie na świecie transmisja kodowana była badana w zastosowaniach ultradźwiękowych [57, 88, 116, 21]. Przegląd i porównanie sygnałów kodowanych w ultrasonografii standardowej przedstawił Misaridis w swojej rozprawie doktorskiej [87]. Przeprowadził on symulacje numeryczne oraz pomiary eksperymentalne przy pomocy dwóch różnych systemów: odpowiednio zmodyfikowanego komercyjnego ultrasonografu (B-K Medical 3535) oraz systemu RA-SMUS [65]. W układzie z ultrasonografem do generacji kodów został użyty zewnętrzny układ laboratoryjny składający się z generatora arbitralnego (LeCroy 9112) oraz wzmacniacza mocy (Ritec 5000). Akwizycja sygnału w.cz. ech była zrealizowana przy pomocy oscyloskopu cyfrowego (LeCroy LC334AM). Dane pomiarowe uzyskano z głowicy o czestotliwości 4 MHz. Misaridis uzyskał 10 dB zysk stosunku sygnał/szum dla pobudzeń optymalnym (ze względu na pasmo głowicy i poziom listków bocznych) sygnałem chirp o długości 20 µs, w porównaniu do pobudzenia dwoma okresami sinusoidy. Pedersen et al. [116] przebadali w warunkach klinicznych zastosowanie sygnału chirp i uzyskali zwiększenie głębokości obrazowania o ok. 2 cm dla głowicy mechanicznej z przetwornikiem na 4 MHz. Behar i Adam [21] zajeli sie zagadnieniem optymalizacji sygnałów kodowanych pod kątem maksymalizacji stosunku sygnał/szum przy minimalizacji poziomu listków bocznych. Stosując apodyzację amplitudy sygnału chirp oraz filtracje niedopasowana (ang. mismatched filtering) uzyskali zwiekszenie stosunku sygnał/szum o 21 dB dla częstotliwości 8 MHz przy jednoczesnym obniżeniu poziomu listków bocznych do poziomu -94 dB.

Obiecujące wyniki transmisji kodowanej oraz wcześniejsze aplikacje obrazowe ultradźwięków wysokiej częstotliwości zadecydowały o rozpoczęciu projektu nowego systemu obrazującego wysokiej częstotliwości wykorzystującego tą technikę. Konieczne zmiany w torze elektronicznym oraz systemie przetwarzania cyfrowego ultrasonografu opartego na transmisji kodowanej wymogły opracowanie całego urządzenia od podstaw. Rozważano budowę aparatu w oparciu o gotowe komercyjne komponenty (np. kartę akwizycji) lub budowę własnej elektroniki. Zdecydowano się na opracowanie w całości własnej elektroniki, dającej większe możliwości dopasowania do aplikacji. Wydaje się, że zastosowanie transmisji kodowanej w ultradźwiękowej technice obrazowej wysokiej częstotliwości jest szczególnie interesujące i potrzebne, ze względu na wysokie tłumienie i niezadowalającą rozdzielczość w zastosowaniach dermatologicznych, oftalmologicznych [141]. Jednak, na dzień dzisiejszy brak w literaturze doniesień (wg. wiedzy autora) na temat praktycznej realizacji tego typu systemu. Właśnie możliwość realizacji nowego doskonalszego narzędzia diagnostycznego była główną motywacją autora tej pracy. Dobry wybór zastosowanych rozwiązań technicznych pozwolił na budowę uniwersalnego systemu akwizycji i przetwarzania, którego aplikacje wykraczają poza pierwotnie przyjęte założenia. Nie bez znaczenia jest także uzyskana miniaturyzacja i niskie koszty rozwiązania. Małe rozmiary i energooszczędność aparatu zapewniają przenośność; niskie koszty dają realną szansę na jego wdrożenie.

Niniejsza praca porusza dość szerokie spektrum zagadnień zwiazanych z realizacja projektu nowego aparatu. Z jednej strony sa to zagadnienia z akustyki (np. rozkłady pól wiazek kodowanych), z drugiej zagadnienia techniczne (elektronika, cyfrowe przetwarzanie sygnałów), z trzeciej zastosowania medyczne. W pracy przedstawiono technike transmisji kodowanej, jej podstawy teoretyczne oraz aplikacje w technice ultradźwiekowej (rozdział 2). Zaprezentowano także oryginalne badania pól promieniowania przetworników pobudzanych przebiegami kodowanymi, które pozwalają zrozumieć sposób obrazowania przy użyciu kodów. Zagadnienia techniczne związane z realizacją projektu nowego aparatu są najistotniejszym elementem składowym tej pracy. Szczególną uwagę poświecono na przegląd, przedstawienie i wybór tych rozwiązań, które umożliwią realizację nowoczesnego systemu. Jednak, nowoczesne rozwiązania techniczne nie były celem samym w sobie, lecz służyły osiągnieciu nowej jakości obrazowania. Umiejętne i optymalne wykorzystanie dostępnych środków technicznych staje się coraz trudniejsze, ze względu na mnogość dostępnych rozwiązań i opcji. W rozdziale 3 przedstawiono przeglad współczesnych softwarowych i hardwarowych metod realizacji cyfrowego przetwarzania sygnałów. Poruszone także zostały zagadnienia przetwarzania analogowo-cyfrowego — w tym rozwiazania układowe oraz ich charakterystyki. Przedyskutowano istotne parametry i warunki pracy tych układów dla sygnałów w.cz.. Opis i porównanie toru przetwarzania klasycznego ultrasonografu z ultrasonografem opartym na technice transmisji kodowanej poprzedza projekt nowego systemu. Projekt aparatu (rozdział 4) składa się z opisu układów elektronicznych (analogowych i cyfrowych), systemu przetwarzania cyfrowego oraz oprogramowania użytkowego. Architektura i metodologia projektowania programowalnych układów cyfrowych FPGA została zaprezentowana ze względu na ich centralne miejsce w projekcie cyfrowym. Tor przetwarzania cyfrowego zrealizowano w pełni softwarowo. Zaproponowano nową zbalansowana architekture przetwarzania w oparciu o procesor główny i procesor graficzny. W dalszej części przedstawiono badania zrealizowanego systemu obrazującego (rozdział 5). Przeprowadzono weryfikację poprawności algorytmów przetwarzania, ilościowe badania porównawcze dla różnych kodów nadawczych oraz badania jakościowe in vivo. W ostatniej części (rozdział 6) podsumowano zrealizowany projekt i wskazano na zakres jego zastosowań oraz dalszych badań. Przedstawiono możliwości rozbudowy systemu, a także zupełnie inne zastosowania jego elementów składowych. Zwrócono także uwagę na nowe możliwości jakie daje próbkowanie i przetwarzanie sygnału w.cz..

## 1.2 Cel pracy

Najważniejszym celem pracy była realizacja obrazowania ultradźwiękowego wysokiej częstotliwości (20–40 MHz) z transmisją kodowaną i przetwarzaniem w czasie rzeczywistym. System ten dzięki zastosowaniu techniki nadawania kodowanego powinien wnieść nową jakość do obrazowania wysokiej rozdzielczości dla zastosowań w dermatologii i oftalmologii. Zalety techniki transmisji kodowanej (zwiększenie głębokości obrazowania, poprawa kontrastu i dynamiki) zadecydowały o potrzebie jej praktycznego wdrożenia w aparacie, który umożliwiłby szerokie zastosowania kliniczne. Wcześniejsze badania laboratoryjne na wybranych kodach wykazały znaczny wzrost stosunku sygnał-szum, który jest bezpośrednim wskaźnikiem kontrastu w obrazowaniu. Podstawowym założeniem projektu było zapewnienie reżimu czasu rzeczywistego dla przetwarzania i obrazowania, co wymagało realizacji bardzo wydajnego systemu akwizycji i transmisji danych oraz algorytmów przetwarzania sygnału w.cz.. Ważnym celem projektu było umożliwienie oceny i realizacji badań porównawczych dla różnych rodzajów sygnałów kodowanych w warunkach laboratoryjnych i klinicznych. Opinia lekarzy jest bardzo istotna i potrzebna przy rozwoju nowych metod obrazowych. Możliwość ewaluacji różnych sposobów nadawania, przetwarzania i wizualizacji oraz ich porównaniu z nadawaniem klasycznym w tych samych warunkach jest nieoceniona. System w założeniach miał wspierać możliwie szeroką gamę sygnałów kodowanych — w szczególności: sygnałów z ciągłą i dyskretną modulacją fazową oraz częstotliwościową (chirp, kody Barkera i Golaya).

W trakcie realizacji projektu stało się jasne, że niewielkim kosztem można będzie zrealizować także dodatkowe cele (np. miniaturyzacja urządzenia, uniwersalność platformy akwizycji i przetwarzania). Wybór nowoczesnych podzespołów, metod i architektury zapewnił bardzo duże możliwości programowania gotowego urządzenia (także w trakcie pracy). Dzięki temu stało się możliwe nie tylko przełączanie "w locie" rodzaju nadawanych kodów i ich bezpośredniego porównania w tych samych warunkach pomiarowych, ale także całkowita zmiana sposobu nadawania, akwizycji i przetwarzania sygnałów. Tego typu funkcje spowodowały, że system pierwotnie dedykowany do jednego celu stał się platformą uniwersalną pozwalającą na nowe zastosowania. Uniwersalność platformy skłoniła autora do rozważań dotyczących architektury aparatów ultrasonograficznych obecnych na rynku i kierunków ich rozwoju.

Zaprojektowany, zrealizowany i przedstawiony w tej pracy system jest uniwersalnym narzędziem, które umożliwia nie tylko badanie transmisji kodowanej w zastosowaniach obrazowych, ale także budowę innych systemów akwizycji i przetwarzania w technice ultradźwiękowej i poza nią. Wdrożenie transmisji kodowanej pozwoli na poprawę jakości obrazowania, a także zwiększenie rozdzielczości w zastosowaniach gdzie jest to wymagane. Lepsza jakość obrazowania powinna wpłynąć dodatnio na skuteczność obecnych metod diagnostyki oraz umożliwić nowe zastosowania. Autor ma nadzieję, że jego praca przynajmniej w pewnym stopniu przyczyni się do rozwoju zastosowań medycznych ultradźwięków.

## 1.3 Ultrasonografia wysokiej częstotliwości

Ultrasonografia wysokiej częstotliwości jest techniką obrazową wykorzystującą fale ultradźwiękowe o częstotliwości powyżej 20 MHz. Rozdzielczość obrazowania związana jest z częstotliwością fali ultradźwiękowej, a w istocie z pasmem przetwornika. Pasmo przetwornika determinuje długość odpowiedzi impulsowej, czyli właśnie rozdzielczość osiową (czasową). Z kolei pasmo przetwornika jest związane z częstotliwością podstawową przetwornika (dla określonego pasma względnego). Rozdzielczość obrazowania oraz możliwy do uzyskania zasięg badania stanowią zawsze kompromis, co jest inherentnym ograniczeniem wynikającym z fizyki samego zjawiska.

Zakres penetracji obrazowania oraz jego jakość (kontrast) są związane bezpośrednio z natężeniem akustycznym fali oraz tłumieniem. Tłumienie fali ultradźwiękowej w tkankach miękkich rośnie w przybliżeniu liniowo z częstotliwością i wynosi średnio 0,6 dB/MHz/cm (od 0,1 dB/MHz/cm dla ciałka szklistego oka do 2 dB/MHz/cm dla skóry) [98]. Dla ultrasonografii wysokiej częstotliwości głębokość badania staje się bardzo ograniczona (np. ok. 6 mm dla 20 MHz). Ponieważ zakres dynamiki elektronicznych układów wejściowych jest ograniczony, zwiększenie głębokości obrazowania wymagało by zwiększenia poziomów nadawania. Jednakże maksymalne poziomy nadawania (ciśnienia akustycznego) są ograniczone w zastosowaniach medycznych ze względów bezpieczeństwa. Tak więc, obecnie stosowane rozwiązania limitują zakres obrazowania i uniemożliwiają dalsze zwiększanie rozdzielczości (częstotliwości), co ogranicza możliwości diagnostyczne oraz nowe zastosowania.

#### 1.3.1 Ograniczenia poziomów nadawania

Dotychczasowe badania nie ujawniły żadnych szkodliwych efektów biologicznych spowodowanych stosowaniem diagnostyki ultradźwiękowej. Oczywiście ultradźwięki jako fale mechaniczne oddziałują na tkanki i mogą wywoływać szkodliwe skutki o ile nie są zachowane bezpieczne poziomy natężenia fali. Kontrolowane bioefekty indukowane falami mechanicznymi są wykorzystywane w terapii np. hipertermia do selektywnego hamowania wzrostu komórek rakowych, litotrypsja do kruszenia kamieni nerkowych. Ultradźwięki mogą powodować dwa rodzaje efektów biologicznych — termiczne oraz mechaniczne. Efekty termiczne polegają na wzroście temperatury badanej tkanki pod wpływem absorpcji części energii fali akustycznej. Efekty mechaniczne, to przede wszystkim kawitacja powodująca powstawanie i zapadanie się bąbelków gazowych mogących powodować uszkodzenia tkanki.

Na podstawie wieloletnich badań eksperymentalnych ustalono, że w zakresie czestotliwości od 0,5 do 10 MHz bioefekty nie wystąpiły dla natężeń I<sub>spta</sub> mniejszych od 100 mW/cm<sup>2</sup> oraz dla czasów nadźwiękawiania t, dla których iloczyn  $I_{spta} \cdot t$  jest mniejszy od 50 J/cm<sup>2</sup> [98]. Zarówno w Stanach Zjednoczonych, jak i w Europie powstały standardy określające maksymalne moce i dawki ultradźwięków stosowanych w diagnostyce [48, 113, 63]. Do 1992 r. standardy te określały bezpieczne natężenia ultradźwięków (Ispta) dla konkretnych aplikacji w zakresie od 17 mW/cm<sup>2</sup> dla oftalmologii do 720 mW/cm<sup>2</sup> dla badań naczyń obwodowych. Obecnie stosowany jest system ODS (ang. Output Display Standard) dający użytkownikowi wskaźniki określające możliwość występowania bioefektów mechanicznych i termicznych dla określonych nastaw aparatu oraz ustalający jedną maksymalną wartość natężenia 720 mW/cm<sup>2</sup> dla wszystkich aplikacji. W celu opisania zależności pomiedzy mierzalnymi parametrami pola a potencjalnymi bioefektami w systemie ODS wprowadzono dwa wskaźniki: indeks termiczny (TI – ang. Thermal Index) oraz indeks mechaniczny (MI – ang, Mechanical Index) [63]. Standardy wymagają aby wskaźniki te były na bieżąco obliczane i wyświetlane na monitorze w trakcie badania w funkcji trybu pracy aparatu oraz typu obrazowanej tkanki. Definicja wskaźników i ich zwiazek z parametrami fizycznymi opiera się na fenomenologicznym modelu wypracowanym na podstawie dotychczasowych doświadczeń i badań [4]. Indeks mechaniczny służy do oszacowania potencjalnych bioefektów mechanicznych takich jak: ruch (ang. streaming) pod wpływem ciśnienia ultradźwięków oraz energii wyzwalanej podczas zapadania się bąbelków wywołanych kawitacją. Warunki wpływające na prawdopodobieństwo efektów mechanicznych nie są jeszcze dobrze poznane; jednak uznaje sie, że prawdopodobieństwo to rośnie wraz ze wzrostem szczytowego ciśnienia fali rozrzedzeniowej oraz maleje ze wzrostem czestotliwości ultradźwiekowej. Ponadto, uważa się, że efekty zaczynają występować dopiero po przekroczeniu pewnej wartości granicznej [15]. Pomimo ugruntowanej w literaturze zależności liniowej tłumienia od częstotliwości, za podstawę do wyznaczania *MI* przyjęto bardziej zachowawczą zależność wykładniczą. W obliczeniach MI stosuje się model tkanki homogenicznej ze średnim tłumieniem 0,3 dB/MHz/cm . Indeks mechaniczny zdefiniowano jako:

$$MI = \frac{p_{ra} \cdot f_{awf}^{-1/2}}{C_{MI}} \tag{1.1}$$

gdzie:

 $C_{MI} = 1 \text{ MPa/MHz}$   $p_{ra}$  — osłabione szczytowe ciśnienie fali rozrzedzeniowej w MPa, przy czym  $p_{ra} = p_r \cdot 10^{-0.015 \cdot f \cdot z}$  oraz  $p_r$  — maksimum ujemnej wartości szczytowej ciśnienia, z — odległość od przetwornika,

f — częstotliwość fali akustycznej;

 $f_{awf}$  — akustyczna częstotliwość pracy w MHz;

 $C_{MI} = 1$  MPa.

Wybrany uproszczony model tłumienia jest usprawiedliwiony na obecnym poziomie zrozumienia warunków powstawania bioefektów mechanicznych, a sam indeks mechaniczny łatwy do implementacji i użycia oraz pozwalający użytkownikowi na minimalizację poziomu wyjścia akustycznego i potencjalnych bioefektów mechanicznych.

Zależność pomiędzy wzrostem temperatury tkanki, a bioefektami zależy od mierzalnych parametrów pola akustycznego, takich jak:

- *P* wyjściowa moc akustyczna; jednostka [W],
- *I<sub>ta</sub>* (ang. Intensity Temporal Average) średnia czasowa natężenia; jednostka [W/cm<sup>2</sup>],
- *I<sub>spta</sub>* (ang. Intensity Spatial Peak Temporal Average) natężenie szczytowe w przestrzeni uśrednione w czasie; jednostka [W/cm<sup>2</sup>].

Żaden z tych parametrów indywidualnie nie jest reprezentatywnym wskaźnikiem wzrostu temperatury indukowanym ultradźwiękami. Kombinacja tych parametrów, łącznie z pewną informacją geometryczną może być użyta do obliczenia indeksów dających oszacowanie wzrostu temperatury w tkankach miękkich i kości. Indeks termiczny został zdefiniowany w następujący sposób:

$$TI = P_p / P_{deg} \tag{1.2}$$

gdzie:

 $P_p$  — parametr mocy w miliwatach (określonym dalej);

 $P_{deg}$  — oszacowana moc w miliwatach potrzebna do podniesienia temperatury tkanki o 1 °C, na podstawie modelu.

Ponieważ przewidywanie i modelowanie termiczne wielu możliwych płaszczyzn skanów ciała ludzkiego jest trudne, zastosowano model uproszczony oparty o warunki średnie. Określono trzy wybieralne przez użytkownika rodzaje indeksu termicznego odpowiadające różnym anatomicznym kombinacjom tkanki miękkiej i kości spotykanym w obrazowaniu ultradźwiękowym (tabela 1.1).

Każdy rodzaj indeksu używa jednego lub więcej modelu *TI*, który jest obliczany na podstawie informacji ze sprzętu — m.in. apertury przetwornika lub rozmiarów wiązki i trybu obrazowania. Parametr mocy ( $P_p$ ) oraz model wzrostu temperatury w tkance zostały określone doświadczalnie dla wybranych typowych warunków w tkance miękkiej, kości, kości czaszki oraz oka.

W przypadku zastosowań obrazowych ultrasonografii wysokiej częstotliwości, gdzie stosowane są głowice z jednym ogniskowanym przetwornikiem skanowanym mechanicznie, ograniczającym parametrem bezpieczeństwa jest  $p_{ra}$  związany ze szczytowymi napięciami impulsów nadawczych.

| Rodzaj <i>TI</i>     | Model TI                       |                   |  |
|----------------------|--------------------------------|-------------------|--|
|                      | Tryb skanowany                 | Tryb nieskanowany |  |
| TIS (tkanka miękka)  | Na powierzchni tkanki miękkiej | Duża apertura     |  |
|                      |                                | Mała apertura     |  |
| TIB (kość)           | Na powierzchni tkanki miękkiej | Kość w ognisku    |  |
| TIC (kość czaszkowa) | Kość na powierz                | chni              |  |

Tabela 1.1: Rodzaje i modele indeksu termicznego

### 1.3.2 Zastosowania

Spektrum zastosowań medycznych ultradźwięków jest bardzo szerokie — zaczynając od diagnostyki, a kończąc na coraz liczniejszych zastosowaniach terapeutycznych. Ultrasonografia wysokiej i bardzo wysokiej częstotliwości (20–100 MHz) jest stosowana w różnych działach medycyny (dermatologia, oftalmologia, kardiologia), kosmetyce oraz w badaniu małych zwierząt [7, 145, 22, 51]. Zastosowania te nie są tak rozpowszechnione i liczne jak ogólna ultrasonografia obrazowa, ale zdobywają coraz większą popularność.

W dalszej części przedstawiono wybrane diagnostyczne zastosowania ultradźwięków wysokiej częstotliwości ograniczając się do zastosowań związanych z głównym tematem pracy.

### 1.3.2.1 Dermatologia

Skóra składa się z trzech głównych warstw (rys. 1.1):

- *Naskórek (ang. epidermis)* zewnętrzna wodoodporna warstwa pełniąca funkcję ochronną. Składa się z warstw: rogowej, ziarnistej, kolczystej oraz podstawnej.
- *Skóra właściwa (ang. dermis)* warstwa środkowa zawierająca naczynia krwionośne, receptory, nerwy i gruczoły; pełni funkcje odżywcze i wspierające.
- *Tkanka podskórna (ang. hypodermis)* warstwa spodnia zbudowana z tkanki łącznej właściwej luźnej. Zawiera komórki tłuszczowe i pełni funkcje izolacji termicznej.

Diagnostyka dermatologiczna powierzchni skóry opiera się głównie na metodach inspekcji wizualnej i palpacji. Cechy anatomiczne i zmiany morfologiczne (tj. kolor, konfiguracja, powierzchnia, twardość, itp.) pozwalają w wielu przypadkach na diagnozę. Inspekcja wizualna jest często wspierana dermatoskopem — urządzeniem powiększającym 10–20x z wystandaryzowanym źródłem światła. Dermatoskopia pozwala na ocenę i różnicowanie zmian barwnikowych, a także, w przypadku urządzeń cyfrowych, na zapamiętywanie i porównywanie wyglądu zmiany w czasie. Badania organoleptyczne dają bardzo ograniczone możliwości oceny zmian podpowierzchniowych — głębokości, rozległości, morfologii. Do oceny głębszych warstw skóry stosuje się badania histopatologiczne (wymagające biopsji) lub nieinwazyjne metody obrazowe (optyczne, ultradźwiękowe oraz jądrowe) [59]. Do metod optycznych, charakteryzujących się największą rozdzielczością, należą mikroskopia konfokalna oraz OCT (ang. Optical Coherence Tomography — optyczna tomografia koherentna). Obie metody umożliwiają uzyskiwania obrazów 2D i 3D z mikrometrową rozdzielczością, ale z bardzo ograniczoną głębokością obrazowania (poniżej 0,5 mm dla mikroskopii i 2–3 mm dla OTC). Ultrasonografia wysokiej częstotliwości, zwana także UBM (ang. Ultrasound Biomicroscopy), pomimo wielu zalet nie



Rysunek 1.1: Budowa skóry (źródło: Wikipedia/www.3dscience.com): 1) por, 2) warstwa rogowa naskórka, 3) warstwa ziarnista naskórka, 4) warstwa kolczasta naskórka, 5) skóra właściwa, 6) ciałka Ruffiniego, 7) gruczoł potowy, 8) ciałka Paciniego, 9) włókna nerwowe, 10) mięsień nastraszający włosa, 11) włókna mięśniowe, 12) tętnica, 13) żyła, 14) cebulka włosa, 15) korzeń włosa, 16) gruczoł łojowy, 17) ciałko Meissnera, 18) trzon włosa

jest obecnie bardzo rozpowszechnioną metodą diagnostyczną w dermatologii. Jednym z powodów jest niewielka liczba komercyjnych aparatów, drugim niewystarczająca rozdzielczość i/lub zasięg (tabela 1.2). Ocena występowania i/lub przebiegu wielu chorób skóry wymaga pomiaru oraz monitorowania zmian rozmiarów poszczególnych struktur, co narzuca warunki na rozróżnialności struktur oraz rozdzielczość obrazowania. W pracy Thiboutot [141] zwrócono uwagę na problem rozdzielczości obecnych urządzeń, jako niewystarczającej do oceny struktur naskórka. Jednocześnie wskazano na obiecującą poprawę rozdzielczości dla przetworników o częstotliwości powyżej 40 MHz, niestety przy jednoczesnym zbyt dużym ograniczeniu zasięgu badania. Dobra rozróżnialność struktur naskórka wymaga zastosowania ultradźwięków o częstotliwości 100 MHz.

W obrazowaniu ultrasonograficznym stosowane są następujące sposoby prezentacji:

- **Prezentacja A (ang. A scan)** przedstawia wykres amplitudy natężenia odbitej fali ultradźwiękowej wzdłuż pojedynczej linii (wiązki) w funkcji głębokości. Prezentacja ta umożliwia określanie grubości warstw tkankowych.
- **Prezentacja B (ang. B scan)** służy do obrazowania za pomocą mapy jasności (obrazu) tworzonej z wielu linii A zbieranych w pewnym obszarze (na pewnej długości). Siła natężenia odbitej fali ultradźwiękowej jest zamieniana na jasność lub kolor punktu obrazu.
- **Prezentacja C (ang. C scan)** jest prezentacją obrazową uzyskiwaną podobnie do prezentacji B, ale w innej płaszczyźnie. Wiązka skanuje pewien obszar (najczęściej prostokątny) powierzchni obiektu; następnie z każdej zebranej linii A wybierane są echa z określonej głębokości. W ten sposób uzyskiwany jest obraz przekroju równoległego do powierzchni z określonej głębokości. Tego typu obraz może być nakładany i porównywany z obrazami optycznymi oraz histopatologicznymi, które są najczęściej wykonywane w tej płaszczyźnie.

| Głebokość [µm] | Szerokość [µm]                                                                             |
|----------------|--------------------------------------------------------------------------------------------|
| Οιξυσκούε [μπ] |                                                                                            |
| 50-100         |                                                                                            |
| 1200-1800      |                                                                                            |
| 800-1200       | 30–60                                                                                      |
| 1500-4000      | 50-100                                                                                     |
| 150-2500       | 150–500                                                                                    |
| 2000           | 400                                                                                        |
|                | 100                                                                                        |
| 3000           | 600                                                                                        |
|                | 140                                                                                        |
|                | Głębokość [μm]<br>50–100<br>1200–1800<br>800–1200<br>1500–4000<br>150–2500<br>2000<br>3000 |

Tabela 1.2: Rozmiary struktur skóry [141]

Badania ultrasonograficzne w dermatologii obejmują: określanie grubości warstw skóry w celu rozpoznawania schorzeń (m.in. łuszczycy, twardziny, nowotworów), monitorowanie gojenia ran i wrzodów oraz określanie rozmiarów i objętości zmian. Bardzo ważnym i obiecującym zastosowaniem UBM jest wczesne wykrywanie nowotworów — w tym najpowszechniejszego i najbardziej zabójczego czerniaka złośliwego (łac. melanoma malignum). Obecnie rozpoznawanie tego nowotworu opiera się na metodach organoleptycznych oraz badaniu histopatologicznym, co uniemożliwia realizację badań przesiewowych na dużą skalę.

### 1.3.2.2 Aparaty komercyjne

Na rynku dostępne są aparaty do zastosowań dermatologicznych i okulistycznych pracujące w zakresie 20–80 MHz. Aparat DermaScan (Cortex Technology, Dania) pracuje z głowicami 20 lub 50 MHz. Dla głowicy 50 MHz umożliwia obrazowanie do 3 mm głębokości z rozdzielczością podłużną do 40 µm. Firma Longport Inc. (USA) jest producentem aparatu Episcan na zakres częstotliwości 16–50 MHz. Cechą szczególną urządzenia jest głowica umożliwiająca obrazowanie o szerokości aż 15 mm. Paradigm Medical Industries (USA) jest producentem kilku modeli aparatów pracujących w zakresie do 50 MHz do zastosowań dermatologicznych i okulistycznych. W Polsce jedynym produkowanym urządzeniem wysokiej częstotliwości jest aparat DESMIN firmy Echo-Son S.A.dostępny z głowicą na 20 MHz. Aparat ten został zrealizowany w oparciu o prototyp urządzenia opracowanego w IPPT. Wszystkie dostępne obecne urządzenia wykorzystują głowice jednoelementowe poruszane mechanicznie gdyż technologia produkcji komercyjnych przetworników wieloelementowych na wysokie częstotliwości nie jest jeszcze dostępna.

#### 1.3.2.3 Oftalmologia

Oko jest niezwykle delikatnym i precyzyjnym organem (rys. 1.2). W diagnostyce oka przeważają metody optyczne dzięki możliwości obrazowania wnętrza oka przez źrenicę. Z drugiej strony metody ultradźwiękowe są standardem w pomiarach rozmiarów struktur oka (biometria — długość gałki ocznej i jej struktur, pachymetria — pomiar grubości rogówki). W oftalmologii stosuje się najczęściej głowice jednoelementowe nieruchome (prezentacja A) lub poruszane mechanicznie (prezentacja B i C) do badań rutynowych w zakresie częstotliwości 5– 15 MHz oraz 15–50 MHz do dokładnej diagnostyki przedniego odcinka gałki ocznej. Głowice, po uprzednim znieczuleniu oka, są sprzęgane z gałką oczną przez kąpiel wodną lub bezpośrednio.

Ponadto występują konkretne wskazania do diagnostyki ultradźwiękowej [67]:

- nieprzezroczyste ośrodki optyczne (bielmo, wylew krwi, zmętnienie soczewki),
- zmiany w przednim odcinku oka (rogówka, komora przednia, ciało rzęskowe, kąt przesączania),
- pomiary gałki ocznej i oczodołu (biometria),
- ocena struktur anatomicznych gałki ocznej (błony naczyniowej, siatkówki, twardówki, kształt gałki, etc.),
- ocena patologii ciałka szklistego (zmętnienie, rozpływ, wylew krwi, etc.),
- diagnostyka guzów wewnątrzgałkowych (nowotwory gałki),
- schorzenia oczodołu (guzy, ocena mięśni, patologie nerwu wzrokowego, etc.) i siatkówki (rozwarstwienia, zwyrodnienia, etc.),
- lokalizacja i ocena ciał obcych oraz ocena zmian pourazowych,
- badanie ukrwienia (metodą Dopplera).



Rysunek 1.2: Budowa oka (źródło: Wikipedia/Chabacano): 1) komora tylna, 2) rąbek zębaty, 3) mięsień rzęskowy, 4) obwódka rzęskowa, 5) kanał Schlemma, 6) źrenica, 7) przednia komora, 8) rogówka, 9) tęczówka, 10) kora soczewki, 11) jądro soczewki, 12) ciałko rzęskowe, 13) spojówka, 14) mięsień skośny dolny, 15) mięsień prosty dolny, 16) mięsień prosty przyśrodkowy, 17) naczynia siatkówki, 18) tarcza nerwu wzrokowego, 19) opona twarda, 20) tętnica środkowa siatkówki, 21) żyła środkowa siatkówki, 22) nerw wzrokowy, 23) żyła wirowata, 24) otoczka, 25) plamka żółta, 26) dołek środkowy, 27) twardówka, 28) naczyniówka, 29) mięsień prosty górny

Przykładowym standardowym aparatem oftalmologicznym jest *OTI-Scan 2000* firmy OTI (Kanada) pracujący z głowicami w prezentacji A oraz B w zakresie 10–50 MHz. Wysoko specjalizowanym aparatem ultradźwiękowym jest *Artemis 2* firmy Ultralink LLC (USA) — realizujący obrazowanie 3D przy częstotliwości 50 MHz. Zastosowano w nim unikalny automatyczny system poruszania głowicy po łuku w celu zapewnienia prostopadłości wiązki ultradźwiękowej do powierzchni oka na całej długości skanowania. Takie rozwiązanie zapewnia jednakowy i optymalny stosunek sygnał-szum dla każdej linii obrazu (gdyż nie ma odbicia wiązki od powierzchni zależnego od kąta padania). Producent specyfikuje 2 µm dokładność pomiaru grubości rogówki. Precyzyjny pomiar rogówki na całej powierzchni jest bardzo istotny dla planowania zabiegów laserowej chirurgii rogówki (LASIK — laser in-situ keratomileusis).

#### 1.3.2.4 Inne zastosowania

Poza przedstawionymi powyżej głównymi zastosowaniami ultradźwięków wysokiej częstotliwości można wymienić także inne:

- *Badania wewnątrz naczyniowe* służą ocenie stanu naczyń krwionośnych za pomocą wprowadzanych do ich wnętrza miniaturowych sond ultradźwiękowych mocowanych na końcu cewnika (tzw. katetery). Obrazowanie ścian naczyń oraz tkanek przyległych jest realizowane przez skanowanie wiązką ultradźwiękową dookoła osi naczynia. Skanowanie wiązką może być realizowane przez mechaniczny obrót przetwornika albo zwierciadła lub przez zastosowanie przetworników wieloelementowych i skanowania elektronicznego. Małe zakresy badania i wymagana wysoka rozdzielczość powodują, że do obrazowania tego typu stosuje się częstotliwości w zakresie 5–40 MHz.
- Obrazowanie małych zwierząt oraz molekularne jest jedną z najnowszych i bardzo dynamicznie rozwijanych aplikacji. Zwierzęta laboratoryjne stanowią podstawę badań leków oraz badań genetycznych. Badania małych zwierząt (np. myszy) ma swoją specyfikę związaną nie tylko z małym rozmiarem (a więc i wymaganą większą rozdzielczością) ale także z inną anatomią i fizjologią (np. serce myszy bije z prędkością 400–800 uderzeń na minutę). Obecnie jedyna firma VisualSonics Inc. (Kanada) specjalizuje się w aparatach do tego typu badań. Oferowany przez nią aparat *Vevo 770* zapewnia obrazowanie z rozdzielczością do 30 µm. System wspiera także badania kardiologiczne dzięki funkcji Dopplera impulsowego oraz opatentowanemu systemowi rekonstrukcji pozwalającemu na uzyskanie obrazowania z efektywną prędkością 1000 obrazów/sek.
- Kosmetyka rozwój produktów kosmetycznych wymaga prowadzenia coraz bardziej zaawansowanych badań. Ogromna wartość rynku produktów kosmetycznych, szczególnie do pielęgnacji skóry, spowodowała dynamiczny rozwój tej gałęzi produkcji, a co za tym idzie badań mających na celu ocenę działania kosmetyków. Badanie, pomiary i monitorowanie wpływu preparatów na poszczególne warstwy skóry wymaga narzędzi diagnostycznych podobnych jak w dermatologii. Obecnie ultradźwięki są powszechnie stosowane w kosmetyce do przeprowadzania zabiegów (np. peeling, sonoforeza, masaż). W niedalekiej przyszłości można spodziewać się rozwoju metod oceny stanu skóry, które pozwolą na dobór kosmetyków do konkretnego rodzaju cery; wydaje się, że metody ultradźwiękowe mogą odegrać tutaj dużą rolę.

## 1.3.3 Podsumowanie

Ultrasonografia wysokiej częstotliwości stanowi ważne narzędzie w wielu dziedzinach medycznych. Nowe i obiecujące zastosowania oczekują na postęp w jakości, rozdzielczości i głębokości obrazowania ultradźwiękowego. Naturalnym kierunkiem dalszego rozwoju będzie migracja metod przetwarzania stosowanych obecnie w ultrasonografii klasycznej (do 10 MHz) do ultrasonografii wysokiej częstotliwości. Wcześniej czy później metody stosowane powszechnie w aparatach niskich częstotliwości (głowice wieloelementowe, metody dopplerowskie, obrazowanie 3D, itp.) zostaną zastosowane w wyższym zakresie częstotliwości. Ze względu na specyficzne aplikacje medyczne technik wysokich częstotliwości niektóre metody wydają się szczególnie interesujące — np. elastografia dla zastosowań dermatologicznych. Z drugiej strony przeniesienie pewnych metod do świata wysokich rozdzielczości może okazać się trudne — np. techniki dopplerowskie do badań mikrokrążenia, ze względu na bardzo małe prędkości przepływu. Jednak najważniejszym zagadnieniem na najbliższe lata pozostaje popularyzacja techniki ultradźwiękowej wysokiej częstotliwości oprzez zwiększenie dostępności aparatów oraz polepszenie stosunku rozdzielczości do głębokości obrazowania.

## Rozdział 2

# Transmisja kodowana

Technika transmisji kodowanej była pierwotnie zastosowana w technice radarowej (od lat 1950) w celu zwiększenia stosunku sygnał-szum w porównaniu do klasycznych (krótkich) sygnałów nadawczych [89]. Zastosowanie długich sygnałów nadawczych powoduje zwiększenie energii impulsu, natomiast szczególna funkcja autokorelacji nadawanych kodów pozwala na odzyskanie rozdzielczości przez kompresję czasową odebranego echa przy jednoczesnym zwiększeniu stosunku sygnał-szum. Istotne jest, że zwiększanie energii sygnału odbywa się przez wydłużanie impulsu a nie zwiększanie szczytowej amplitudy sygnałów nadawczych, która w praktycznych zastosowaniach jest ograniczona albo ze względów technicznych (radary) albo względów bezpieczeństwa (w ultrasonografii). Technika transmisji kodowanej jest obecnie szeroko stosowana także w telekomunikacji oraz w innych systemach typu puls-echo np. sonary, pomiary odległości (optyczne, akustyczne), ultradźwiękowe badania nieniszczące, ultrasonografia, technika dopplerowska, etc.

## 2.1 Sygnały kodowane

Proces kodowania sygnału jest standardowo rozpatrywany w teorii informacji. Kodowanie służy do zwiększenia ilości i/lub jakości (zmniejszenia stopy błędów) transmisji danych przez kanał komunikacyjny. Schemat systemu telekomunikacyjnego można przedstawić w postaci:

 $(dane wej.) \rightarrow (koder) \rightarrow (kanał komunikacyjny) \rightarrow (dekoder) \rightarrow (dane wyj.)$ 

W powyższym modelu komunikacji zakłada się, że kanał jest obciążony szumem i zniekształceniami, które wpływają na jakość transmisji. W przypadku zastosowań typu puls-echo (radary, ultrasonografia) proces "transmisji danych" można rozumieć, przez analogię, jako przesłanie impulsu próbkującego przez tor składający się z układów elektronicznych, przetwornika i ośrodka, a następnie detekcji sygnałów ech. Detekcja to wydobywanie informacji zawartej w sygnale odbiorczym poprzez wykrywanie sygnału użytecznego, czyli niosącego informację. Jakość detekcji sygnału jest związana z parametrami toru komunikacyjnego (stosunek sygnałszum) oraz z zastosowanym sposobem kodowania.

W ultrasonografii parametr sygnał-szum toru nadawczo-odbiorczego determinują:

- 1. poziom energii impulsów nadawczych,
- 2. efektywność przetwornika ultradźwiękowego,
- 3. dynamika przetwornika A/C (szum kwantyzacji),

4. szum elektroniczny (w tym termiczny).

Tak więc, przy ustalonych parametrach technicznych przetwornika A/C, zminimalizowanym szumie elektronicznym oraz ograniczonym ze względów bezpieczeństwa maksymalnym poziomie ciśnienia impulsów nadawczych jedynym sposobem poprawy parametrów toru jest zastosowanie kodowania sygnałów, które umożliwia zwiększenie całkowitej energii impulsów nadawczych. Amplitudy ciśnienia akustycznego impulsów nadawczych generowanych w komercyjnych aparatach są obecnie zbliżone do limitów określonych przez normy bezpieczeństwa [34], tak więc ich zwiększanie jest niemożliwe.

#### 2.1.1 Rodzaje kodów

W ultrasonografii, podobnie jak w innych systemach puls-echo, obowiązuje znana z techniki radarowej zależność dla rozdzielczości zasięgowej [75]:

$$\Delta R = \frac{cT}{2} = \frac{c}{2B} \tag{2.1}$$

gdzie: *c* — prędkość fali w ośrodku, *T* — czas trwania impulsu, *B* — pasmo impulsu.

Dla klasycznie stosowanych krótkich impulsów (rys. 2.1) istnieje bezpośredni związek wiążący czas trwania impulsu T z szerokością pasma  ${}^{1} B = 1/T$ .



Rysunek 2.1: Związek długości impulsu z jego spektrum amplitudowym (na podstawie [75])

Określany dla impulsów parametr *TB* (ang. Time-Bandwidth Product) będący iloczynem czasu trwania impulsu i jego pasma jest w tym wypadku bliski jedności. Zastosowanie modulacji (kodowania) pozwala na poszerzenie widma impulsu niezależnie od długości jego trwania. Sygnały kodowane charakteryzują się wartością *TB* większą od jedności. Parametr *TB* określa także możliwy do uzyskania wzrost stosunku sygnał-szum po kompresji czasowej i jest związany z zyskiem filtru dopasowanego (patrz podrozdział 2.1.2).

Sygnały kodowane możemy podzielić na ciągłe i dyskretne w zależności od typu zmian charakterystyki sygnału w czasie. Wyróżniamy trzy podstawowe metody modulacji analogowej (ciągłej):

• AM (ang. Amplitude Modulation — modulacja amplitudy)

<sup>&</sup>lt;sup>1</sup>Przybliżenie dla fizycznie realizowalnych sygnałów o skończonym czasie trwania i ograniczonym paśmie. Teoretycznie sygnały o skończonym czasie trwania mają nieskończenie szerokie pasmo.

- FM (ang. Frequency Modulation modulacja częstotliwości)
- PM (ang. Phase Modulation modulacja fazy)

oraz odpowiadające im metody modulacji binarnej [153]:

- ASK (ang. Amplitude Shift Keying kluczowanie amplitudy)
- FSK (ang. Frequency Shift Keying kluczowanie częstotliwości)
- PSK (ang. Phase Shift Keying kluczowanie fazy)

Najpopularniejszy sygnał kodowany chirp jest sygnałem ciągłym otrzymanym przez liniową modulację częstotliwości. Kody algebraiczne (np. kody Barkera, Golaya) należą do kategorii sygnałów binarnych i do ich generacji używa się metod modulacji binarnej. Podstawowe własności najczęściej stosowanych sygnałów kodowanych przedstawiono w kolejnych podrozdziałach.

Immanentną cechą transmisji kodowanej jest powstawanie listków bocznych w procesie kompresji czasowej, które mogą maskować położone blisko siebie echa. Do charakteryzacji tego efektu stosuje się następujące parametry:

• *PSL* (ang. Peak-to-Sidelobe Level) — stosunek maksymalnej amplitudy listków bocznych do listka głównego

$$PSL = 10\log_{10}\left(\frac{Max(x_i^2)}{x_0^2}\right),$$
(2.2)

• *ISL* (ang. Integrated Sidelobe Level) — stosunek całkowitej energii listków bocznych do energii listka głównego

$$ISL = 10\log_{10}\left(\frac{\sum_{i=-N}^{N} x_i^2}{x_0^2}\right)$$
(2.3)

gdzie:  $x_0$  jest amplitudą listka głównego,  $x_i$  są amplitudami listków bocznych i długość sygnału wynosi 2N.

#### 2.1.1.1 Sygnał chirp

Sygnał chirp, zwany także sygnałem z liniową modulacją częstotliwości LFM (ang. linear frequency modulation) był pierwszym typem sygnału stosowanym praktycznie w technice radarowej.

Faza sygnału o liniowej modulacji częstotliwości ma zależność kwadratową od czasu:

$$\Phi(t) = 2\pi \left( f_0 t + \frac{\mu}{2} t^2 \right) \quad \text{dla} \quad -\frac{T}{2} \le t \le \frac{T}{2}$$
(2.4)

gdzie:  $f_0$  — częstotliwość środkowa sygnału, parametr  $\mu = 2\pi B/T$ .

Korzystając ze standardowej funkcji okna prostokątnego o szerokości jednostkowej (*Rect*) sygnał chirp w zapisie zespolonym przyjmuje postać:

$$chirp(t) = Rect\left(\frac{t}{T}\right)e^{2\pi i (f_0 t + \frac{\mu}{2}t^2)}.$$
(2.5)



Rysunek 2.2: Zależności czasu i częstotliwości dla sygnału chirp o rosnącej (lewy) i malejącej (prawy) częstotliwości

Na rys. 2.2 przedstawiono sygnały chirp o rosnącej i malejącej liniowo w czasie częstotliwości.

Skompresowany sygnał chirp ma obwiednię o kształcie funkcji *sinc*, co wynika bezpośrednio z kształtu prostokątnego okna czasowego (wzór 2.5). Wynikiem tego jest wysoki poziom listków bocznych (*PSL* = 13 dB), który jest niezależy od iloczynu *TB*. Metodą obniżenia poziomu listków bocznych jest zastosowanie okien amplitudowych w dziedzinie czasu lub częstotliwości — tzw. filtracja niedopasowana. Wyczerpujący przegląd okien i ich charakterystyk opracował Harris [58]. W tabeli 2.1 przedstawiono parametry kilku najczęściej stosowanych w technice radarowej okien. Jak widać zastosowanie okien pozwala na znaczące obniżenie poziomu listków bocznych (poniżej –40 dB) ale kosztem poszerzenia listka głównego oraz niewielkim spadkiem stosunku sygnał-szum. Istnieją także alternatywne metody minimalizacji poziomu *PSL* — np. nieliniowa modulacja częstotliwości sygnału chirp, które zostały szczegółowo opisane w literaturze radarowej [89, 19, 130]. Modulacja nieliniowa pozwala na kształtowanie widma sygnału chirp w celu dopasowania go do pasma nadajnika (anteny, przetwornika) przy zachowaniu prostokątnego okna przebiegu czasowego oraz optymalnej filtracji dopasowanej.

| Funkcja okna              | PSL [dB] | Względna szerokość | Zmiana   |
|---------------------------|----------|--------------------|----------|
|                           |          | listka głównego    | SNR [dB] |
| Prostokątne               | 13       | 1,0                | 0        |
| Hamminga                  | 43       | 1,5                | -1,34    |
| (Kosinusowe) <sup>2</sup> | 32       | 1,59               | -1,76    |
| (Kosinusowe) <sup>3</sup> | 39       | 1,41               | -2,38    |
| Dolph-Czebyszewa          | 40       | 1,41               | -1,20    |

Tabela 2.1: Charakterystyka kompresji czasowej dla wybranych okien amplitudowych [58, 19]

#### 2.1.1.2 Kody Barkera

Kody Barkera są kodami algebraicznymi, które dla danej długości N charakteryzują się funkcją autokorelacji o maksimum równym N przy maksymalnym poziomie listków bocznych równym 1. W praktycznych zastosowaniach kody algebraiczne nie są nadawane bezpośrednio lecz modulują binarnie amplitudę, fazę lub częstotliwość sygnału nośnego. Na rys. 2.3 pokazano

najczęściej stosowaną binarną modulację fazową, w której zmiany wartości kodu powodują zmianę fazy sygnału nośnego o  $\pm \pi$ .



Rysunek 2.3: 7-bitowy kod Barkera oraz modulowany nim fazowo sygnał sinusoidalny (na podstawie [75])

Podstawową wadą kodów Barkera jest to, że występują jedynie kody o długościach 2, 3, 4, 5, 7, 11 i 13 bitów (tabela 2.2). Dla kodu o maksymalnej dostępnej długości 13-bitów poziom listków bocznych wynosi –22,3 dB. W zastosowaniach gdzie potrzebne są dłuższe kody stosuje się produkt Kroneckera dwóch krótszych kodów — dla dwóch kodów Barkera o długościach N i M ich iloczyn Kroneckera ma długość  $N \cdot M$ . Niestety dla takich kodów listki boczne są większe od 1.

| Tahela | 22.  | Kody | Barkera | [75] |
|--------|------|------|---------|------|
| Tabela | 2.2. | Rouy | Darkera | [73] |

| Symbol kodu           | Długość kodu | Kody                                                | PSL [dB] |
|-----------------------|--------------|-----------------------------------------------------|----------|
| <i>B</i> <sub>2</sub> | 2            | $\{1, -1\}, \{1, 1\}$                               | 6,0      |
| $B_3$                 | 3            | $\{1, 1, -1\}$                                      | 9,5      |
| $B_4$                 | 4            | $\{1, 1, -1, 1\}, \{1, 1, 1, -1\}$                  | 12,0     |
| $B_5$                 | 5            | $\{1, 1, 1, -1, 1\}$                                | 14,0     |
| $B_7$                 | 7            | $\{1, 1, 1, -1, -1, 1, -1\}$                        | 16,9     |
| $B_{11}$              | 11           | $\{1, 1, 1, -1, -1, -1, 1, -1, -1, 1, -1\}$         | 20,8     |
| $B_{13}$              | 13           | $\{1, 1, 1, 1, 1, -1, -1, -1, 1, 1, -1, 1, -1, 1\}$ | 22,3     |

#### 2.1.1.3 Kody Golaya

Kody Golaya należą do szerszej klasy komplementarnych kodów algebraicznych. Kody komplementarne składają się z pary kodów o długości *N*, których funkcje autokorelacji mają listki boczne o tej samej wartości ale przeciwnych znakach. Dzięki temu suma funkcji autokorelacji posiada listek główny o amplitudzie 2*N* i całkowity brak listków bocznych. Opis i metody generacji kodów Golaya można znaleźć w pracy Borwein [24]. Dostępność algorytmów generacji kodów pozwala na łatwe tworzenie arbitralnie długich sekwencji.

Proces nadawczo-odbiorczy oraz kompresji kodów Golaya przebiega następująco:

- 1. Nadanie kodu A (pierwszy z pary kodów).
- 2. Odbiór ech dla kodu A.
- 3. Nadanie kodu *B* (drugi z pary kodów).
- 4. Odbiór ech dla kodu *B*.
- 5. Filtracja dopasowana sygnałów ech dla kodu A oraz B.



Rysunek 2.4: Algorytm kompresji kodów Golaya
6. Sumowanie koherentne skompresowanych czasowo sygnałów ech A i B.

Na rys. 2.4 przedstawiono algorytm kompresji i przebiegi czasowe dla 16-bitowych kodów Golaya.

Należy zaznaczyć, że podwójne nadawanie wiąże się z dwukrotnym wydłużeniem czasu akwizycji sygnału oraz podwójną kompresją czasową. Ponadto wszelki ruch celu pomiędzy kolejnymi transmisjami powoduje pojawienie się listków bocznych wynikających z dekorelacji pomiędzy echami.

#### 2.1.1.4 Inne kody

Poza przedstawionymi powyżej najczęściej stosowanymi sygnałami kodowanymi w niektórych zastosowaniach spotyka się jeszcze inne rodzaje kodów m.in. [53]:

- **Optymalne kody binarne** charakteryzujące się minimalnym poziomem listków bocznych spośród wszystkich kodów o danej długości *N* zwane także kodami MPS (ang. Minimum Peak Sidelobe). Kody optymalne są znajdowane przez przeszukanie wszystkich możliwych kombinacji bitowych. Poziom listków bocznych wynosi 2 lub więcej; przypomnijmy, że dla kodów Barkera był równy 1.
- **Kody pseudo przypadkowe** zwane także MLS (ang. Maximum Length Sequences) są ciągami zero-jedynkowymi charakteryzującymi się statystyką rozkładu losowego. Ciągi MLS, ze względu na sposób ich generacji, są faktycznie periodyczne, czyli powtarzają się po pewnej z góry określonej liczbie elementów. Funkcja autokorelacji tych kodów o długości *L* przyjmuje wartość:

$$\varphi(n) = \begin{cases} L & \text{dla} \quad n = 0, \pm L, \pm 2L, \dots \\ -1 & \text{wszędzie indziej.} \end{cases}$$
(2.6)

Kody MLS są generowane za pomocą rejestrów przesuwnych ze sprzężeniem zwrotnym LFSR (ang. Linear Feedback Shift Register) — rys. 2.5. Dla niektórych kombinacji sprzężeń zwrotnych rejestr LFSR jest rejestrem o tzw. maksymalnej długości, który przechodzi przez wszystkie  $N = 2^p - 1$  stanów, gdzie p jest liczbą bitów rejestru. Rejestry LFSR są szeroko stosowane w telekomunikacji (poszerzanie widma, generacja szumu białego, maskowanie), kryptografii (generacja kluczy, generatory losowe) i technice cyfrowej (szybkie liczniki, generatory wektorów testowych). Dużą zaletą LFSR jest ich prosta konstrukcja i łatwa implementacja w strukturach FPGA [146]

#### 2.1.2 Filtracja dopasowana

Filtr dopasowany jest niezmienniczym w czasie filtrem liniowym, który stanowi rozwiązanie zagadnienia optymalizacji stosunku sygnał-szum na wyjściu odbiornika w obecności białego szumu gaussowskiego [144].

Przyjmując gęstość mocy szumu  $N_0/2$  [W/Hz] i pasmo odbiornika B, moc szumu w paśmie filtru dopasowanego można zapisać [75]

$$N_i = 2\frac{N_0}{2}B.$$
 (2.7)

Dla sygnału o energii całkowitej E i czasie trwania T średnia energia sygnału wynosi

$$S_i = \frac{E}{T}.$$
(2.8)



Rysunek 2.5: Układ 4-bitowego rejestru LFSR – generatora ciągu MLS o długości 15

Obliczając stosunek sygnał-szum na wejściu filtru dopasowanego otrzymujemy

$$SNR_i = \frac{S_i}{N_i} = \frac{E}{N_0 TB}.$$
(2.9)

Korzystając z własności autokorelacji SNR na wyjściu filtru dopasowanego wynosi

$$SNR_o = \frac{2E}{N_0}.$$
(2.10)

Porównując 2.9 z 2.10 otrzymujemy

$$\frac{SNR_o}{SNR_i} = 2TB.$$
(2.11)

Czynnik *TB* o jaki następuje zwiększenie wyjściowego *SNR* nazywany jest wzmocnieniem filtru dopasowanego lub wzmocnieniem kompresji.

#### 2.2 Sygnały kodowane w ultrasonografii

Zainteresowanie transmisją kodowaną w technice ultradźwiękowej zaczęło się w latach 1970 i dotyczyło metod dopplerowskich, badań nieniszczących oraz obrazowania [35]. Współcześnie zagadnieniami kodów w zastosowaniach obrazowych zajmowali się m.in.: Rao [125, 126], O'Donnel [110], Misaridis, Pedersen i Jensen [88, 116, 87] oraz naukowcy Zakładu Ultradźwięków IPPT [100, 103, 143, 72, 101, 70, 99, 71, 104].

W ultrasonografii zastosowanie kodowania ma ten sam cel, co w technice radarowej — zwiększenie jakości/głębokości obrazowania bez zwiększania szczytowej amplitudy sygnałów nadawczych. Amplitudy ciśnienia stosowane w obecnych aparatach komercyjnych zbliżają się do wartości maksymalnych określonego przez normy bezpieczeństwa. Dlatego, istotne jest, że zwiększanie energii w procesie kodowania odbywa się nie poprzez zwiększanie amplitudy impulsu, a poprzez czas trwania sygnału. Obecnie w ultradźwiękowej transmisji kodowanej stosuje się głównie sygnały z liniową modulacją częstotliwości (tzw. chirp) oraz z dyskretną modulacją fazy za pomocą kodów algebraicznych (np.: kody Barkera, kody Golaya).

Należy zaznaczyć, że zastosowanie kodów w ultrasonografii różni się znacząco od techniki radarowej — nie jest równie efektywne oraz wymaga dodatkowych zabiegów i optymalizacji w celu uzyskania dobrych rezultatów. Chodzi tu przede wszystkim o specyfikę związaną z falami ultradźwiękowymi oraz ograniczeniami technicznymi:

- Silna zależność tłumienia od częstotliwości w ośrodkach biologicznych powodująca zniekształcenia nadawanych sygnałów kodowanych, a przez to ich niedopasowanie i suboptymalną kompresję czasową.
- Nieliniowa propagacja fal w ośrodkach biologicznych, która powoduje przepływ części energii fali do wyższych harmonicznych, a tym samym zniekształcenie ech i ich dekorelację z sygnałem nadawczym.
- Ograniczone pasmo przetworników ultradźwiękowych, które uniemożliwia nadawanie kodów o zbyt szerokim widmie, przez co ogranicza możliwy do uzyskania zysk *TB*.
- Znacznie ograniczona maksymalna długość stosowanych kodów, a przez to zysku *TB*, która wynika z możliwej do zaakceptowania strefy martwej<sup>2</sup> obrazowania.

Ograniczenia maksymalnego czasu trwania i pasma sygnału powodują, że zakres możliwego do uzyskania iloczynu *TB* w ultrasonografii jest rzędu 100, podczas gdy w radarach rzędu 1000. Nieliniowa propagacja oraz tłumienie w tkance, które zniekształcają sygnały ech, powodują, że efektywna wartość *TB* dla sygnału kodowanego zmniejsza się z głębokością. Przykładowo Rao [125] wykazał, że dla sygnału chirp o paśmie 2,12 MHz i czasie trwania 12,5  $\mu$ s, tj. *TB* = 20 w ośrodku o tłumieniu 0,86 dB/MHz/cm efektywna wartość *TB* spada do ok. 5 na głębokości 5 cm. Rao wskazywał także na możliwość filtracji niedopasowanej zależnej od głębokości — tj. uwzględniającej zmiany kształtu widma echa spowodowane tłumieniem w tkance. W ultrasonografii kodowanej mamy do czynienia z trzema źródłami szumu: szum elektroniczny (toru odbiorczego oraz przetwornika A/C), szum ziarna (speckle) oraz szum korelacyjny związany z występowaniem listków bocznych po kompresji czasowej — ten ostatni nie występuje przy klasycznym nadawaniu krótkich impulsów. Szum ziarna dominuje w obrazie tkanki na mniejszych głębokościach, natomiast po przekroczeniu wartości krytycznej głębokości (zależnej od stosowanej częstotliwości ultradźwięków) zaczyna dominować szum odbiornika. Właśnie w tym regionie wzmacniające działanie kodów jest najbardziej pożądane.

Bardzo istotnym, z punku widzenia zastosowań obrazowych, jest poziom szumu wprowadzanego przez filtracje dopasowana (ang. self-clutter). Poziom listków bocznych przekłada sie bezpośrednio na rozróżnialność blisko siebie położonych ech (struktur). Ponieważ standardowy poziom listków bocznych dla sygnału chirp wynosi jedynie  $-13 \, \text{dB}$  i jest nieakceptowalny dla obrazowania, wiele prac zostało poświęconych zagadnieniom i metodom ich minimalizacii [87, 21, 55, 112, 111] Behar i Adam [21] oraz Oelze [112, 111] rozpatrywali różne metody filtracji niedopasowanej dla sygnałów chirp w celu minimalizacji PSL. Behar i Adam [21] uzyskali dla zoptymalizowanego sygnału chirp o częstotliwości centralnej 8 MHz PSL = 94 dB i zysk stosunku sygnał-szum 21 dB. Oelze [112, 111] stosował equalizacje sygnału chirp w celu kompensacji spadku amplitudy na krańcach pasma przenoszenia przetwornika. Dla przetwornika o częstotliwości 2,25 MHz uzyskał on niemal dwukrotne zwiększenie efektywnego pasma toru nadawczo/odbiorczego (z 56% do 113%), co pozwoliło zwiekszyć rozdzielczość podłużna z 0,44 mm do 0,31 mm przy zachowaniu poziomu listków bocznych poniżej –45 dB oraz zysku sygnał-szum powyżej 9 dB. W rzeczywistych zastosowaniach ograniczone pasmo przetworników ultradźwiękowych działa jak amplitudowa funkcja okienkująca i powoduje automatyczne obniżenie listków bocznych. Otrzymanie optymalnej filtracji niedopasowanej wymaga uwzględnienia kształtu pasma przetwornika. Inną metodą kontroli pasma sygnałów chirp oraz

<sup>&</sup>lt;sup>2</sup> Strefa martwa to obszar od czoła głowicy do pewnej głębokości, który nie może być obrazowany. Wielkość tej strefy wynika z czasu trwania nadawanego kodu — cały kod musi zostać nadany zanim można zacząć odbierać echa.

poziomu *PSL* jest zastosowanie nieliniowej modulacji częstotliwości (tzw. nieliniowy chirp). Misaridis [87] oraz Gran [55] rozważali zagadnienie optymalnego dopasowania pasma sygnału pobudzającego do pasma przetwornika dla sygnału chirp. Nieliniowy sygnał chirp pozwolił na uzyskanie, bez potrzeby stosowania filtracji niedopasowanej, *PSL* = 80 dB oraz 7 dB zysk *SNR* w stosunku do liniowego sygnału chirp.

Kody fazowe charakteryzują się znacznie szerszym pasmem, trudniejszą kontrolą nad poziomem listków bocznych, większą czułością na przesunięcie dopplerowskie oraz mniejszą odpornością na zniekształcenia wywołane tłumieniem zależnym od częstotliwości. Podnosząc te argumenty niektórzy naukowcy (np. Misaridis [87]) stoją na stanowisku, że kody fazowe w ogóle nie nadają się do zastosowań w ultrasonografii. Inni badacze wskazują na dużą skuteczność, a czasami nawet na przewagę kodów fazowych. Przykładowo Chiao [34] porównywał zastosowanie zoptymalizowanego sygnału chirp i kodów Golaya do obrazowania. Wykazał on w symulacji uwzględniającej tłumienie i propagacją nieliniową, że przy jednakowej rozdzielczości podłużnej, kod Golaya zapewniał w stosunku do sygnału chirp o 7 dB wyższy stosunek sygnałszum oraz poziom listków bocznych gorszy o jedynie 3 dB. Badania prowadzone przez autora oraz współpracowników wskazują, że kody fazowe (w szczególności kody Golaya) charakteryzują się dużą odpornością na zniekształcenia spowodowane ograniczonym pasmem głowicy oraz zadowalającą odpornością na efekty tłumienia w tkance i nadają się do obrazowania w zakresie wysokich częstotliwości ultradźwiękowych. Słaba odporność na efekt Dopplera nie stanowi problemu w zastosowaniach obrazowych.

## 2.2.1 Aspekty techniczne

Praktyczna implementacja techniki transmisji kodowanej w ultrasonografii wymaga poważnych modyfikacji toru przetwarzania analogowego i cyfrowego aparatu (wymagane zmiany oraz schemat blokowy ultrasonografu z transmisją kodowaną przedstawiono w podrozdziale 4.1.1).

Do najważniejszych zmian należy zaliczyć: eliminację analogowej kompresji logarytmicznej w torze odbiorczym (wymóg liniowości), dużą dynamikę przetwarzania A/C (wynikająca z liniowości toru odbiorczego) oraz wymagającą dużej mocy obliczeniowej kompresję czasową sygnałów ech w.cz.. Zmiany te są na tyle poważne, że do dnia dzisiejszego transmisja kodowana, pomimo swoich niewątpliwych zalet, nie jest standardową opcją nawet w wyższej klasie aparatów [49].

W zależności od rodzaju stosowanych kodów tor nadawczy dla transmisji kodowanej musi być zakończony wzmacniaczem liniowym mocy (dla sygnałów chirp) lub układem impulsowym zdolnym do generacji impulsów z modulacją fazy (dla kodów fazowych). O ile układy nadajników impulsowych są dość proste w realizacji i energooszczędne, to liniowe wzmacniacze mocy wymagają znacznie bardziej złożonych układów oraz charakteryzują się wyższym poborem prądu. Pollakowski i Ermert [121] zaproponowali sygnał pseudochirp będący sygnałem prostokątnym o liniowo zmieniającym się okresie. Układ generacji i wzmocnienia tego typu sygnału jest znacząco prostszy od układów potrzebnych do generacji sygnału chirp, a efekt jego stosowania zbliżony do standardowego sygnału chirp.

Do generacji sygnałów z modulacją częstotliwości oraz fazy może być stosowana metoda bezpośredniej syntezy cyfrowej DDS (ang. Direct Digital Synthesis) [8]. Metoda DDS (rys. 2.6) korzysta z rejestru akumulatora fazy, który w każdym cyklu zegara systemowego jest zwiększany o zadaną wartość (słowo sterujące). Wartość rejestru fazy jest konwertowana na cyfrową wartość amplitudy sygnału sinusoidalnego, a następnie na sygnał analogowy przez przetwornik C/A.



Rysunek 2.6: Schemat blokowy układu bezpośredniej syntezy cyfrowej DDS (na podstawie [8])

Częstotliwość wyjściowa układu DDS wynosi

$$F_{\text{wyj.}} = M \cdot \frac{CLK}{2^N},\tag{2.12}$$

gdzie: M — słowo sterujące (przyrost fazy), CLK — częstotliwość zegara systemowego, N — liczba bitów rejestru akumulatora fazy.

Rozdzielczość częstotliwości DDS zależy od liczby bitów akumulatora fazy ( $CLK/2^N$ ). W praktycznych implementacjach stosuje się rejestry o długości 16–32-bitów, co zapewnia bardzo precyzyjne strojenie. Wykorzystanie układów DDS do generacji sygnałów modulowanych fazowo sprowadza się do programowania słowa sterującego według zadanej krzywej w czasie. Generatory DDS są obecnie powszechnie stosowane i dostępne w postaci gotowych układów scalonych lub implementowane w układach FPGA [43]. Innym sposobem generacji sygnałów jest cyfrowy generator arbitralny, który pozwala na wytwarzanie sygnałów o dowolnym kształcie. Układy generatorów arbitralnych są najczęściej realizowane w strukturach FPGA za pomocą bloku pamięci, w której składowana jest sekwencja próbek.

Osobnym zagadnieniem jest realizacja kompresji czasowej ech. W systemach radarowych stosuje się analogowe filtry z falą powierzchniową SAW (ang. Surface Acoustic Wave), które realizują proces kompresji. Początkowo w zastosowaniach ultradźwiękowych także próbowano stosować analogowe metody przetwarzania ale szybko okazały się one niewystarczające. Analogowe filtry wszechprzepustowe do kompresji sygnału chirp były badane symulacyjnie i praktycznie przez Nowickiego [100] oraz Trotsa [142]. Pasywne filtry tego typu są wielostopniowe i wymagają bardzo dużej dokładności elementów filtru. Ponadto wymagana jakość montażu, duża wrażliwość na zmiany temperatury i starzenie się elementów powodują, że ich stosowanie jest niepraktyczne.

Obecnie w zakresie częstotliwości ultradźwiękowych możliwe jest bezpośrednie cyfrowe próbkowanie sygnału w.cz. i jego cyfrowa obróbka. W praktyce stosuje się próbkowanie z częstotliwością 2–5 razy wyższą od częstotliwości podstawowej ultradźwięków. Wymóg liniowości toru przetwarzania oraz wysoka dynamika sygnałów ech ultradźwiękowych wymaga stosowania przetworników A/C o rozdzielczości 12–14-bitów. Spróbkowane dane muszą być następnie poddane cyfrowej kompresji czasowej (filtracji dopasowanej). Stosuje się tutaj albo metodę korelacyjną działającą w dziedzinie czasu lub metodę opartą na transformacie FFT. Metoda FFT polega na obliczaniu korelacji w dziedzinie częstotliwości przez mnożenie transformat sygnału oraz kodu (wzorca). W każdym przypadku dla uzyskania obrazowania w czasie rzeczywistym wymagana jest bardzo duża prędkość obliczeń. Metoda korelacyjna ma koszt obliczeniowy  $O(N \cdot M)$ , gdzie N jest długością sygnału, a M długością kodu. Dla obrazu składającego się z 200 linii sygnału w.cz. o długości 2000 próbek każda, długości kodu 250 próbek i prędkości obrazowania 10 Hz należy wykonać 200 · (2000 · 250) · 10 = 1 · 10<sup>9</sup> operacji na sekundę! Dla kodów binarnych możliwe jest zmniejszenie liczby operacji przez wstępną demodulację na częstotliwości podstawowej i decymację sygnału ech.

#### 2.2.2 Wpływ pasma głowicy na sygnały kodowane

Głowica ultradźwiękowa stanowi filtr środkowoprzepustowy dla sygnałów nadawczych oraz odbieranych ech. Ograniczenie pasma efektywnie działa jak filtr niedopasowany dla sygnałów chirp i obniża poziom listków bocznych. Dobór pasma sygnału chirp do dostępnego pasma głowicy jest stosunkowo prosty i został przedstawiony w pracach Behara [21] i Misaridisa [87].

Możliwości optymalizacji pasma sygnałów kodowanych fazowo są ograniczone. Jedna z metod polegająca na zwiększeniu liczby okresów przypadających na jeden bit kodu Golaya była przebadana przez Nowickiego i współpracowników [104]. Stwierdzono, że dla 8-bitowych kodów Golaya i przetworników o paśmie 25%, 58%, 80% ograniczenie pasma kodu Golaya przez wydłużenie do dwóch okresów długości jednego bitu powoduje zwiększenie amplitudy ech o odpowiednio 1,88; 1,62; 1,47 razy. Badania były przeprowadzone w wodzie przy odbiciu od reflektora płaskiego.

#### 2.2.3 Rozkłady pola dla pobudzeń kodowanych

W ramach prac badawczych dotyczących zastosowań transmisji kodowanej autor i współpracownicy badali rozkłady pól akustycznych dla pobudzeń klasycznych oraz kodowanych [99]. Kształt pola przetwornika ultradźwiękowego ma podstawowe znaczenie dla większości aplikacji, a szczególnie dla technik obrazowych.

Punktową funkcję rozmycia PSF (ang. Point Spread Function) dla sygnałów chirp badał Rao [126]. Porównał on zachowanie funkcji PSF dla pobudzenia klasycznego oraz sygnłu chirp o paśmie dobranym do przetwornika (częstotliwość centralna 2 MHz, pasmo 1,43 MHz). Rao uzyskał dużą zgodność funkcji PSF dla obu typów pobudzeń w zakresie dynamiki 0–60 dB w wodzie.

W Zakładzie Ultradźwięków przebadano i porównano przestrzenne rozkłady pola ultradźwiękowego dla pięciu różnych sygnałów nadawczych:

- 1. sygnały sinusoidalne 2 i 16 okresów,
- 2. sygnał z liniową modulacją częstotliwości (chirp) o czasie trwania 8 µs i paśmie 1 MHz,
- 3. sygnał modulowany fazowo kodem Barkera 13-bitowym,
- 4. sygnał modulowany fazowo 16-bitowym komplementarnym kodem Golaya.

Pomiary rozkładu pola wykonano za pomocą automatycznego skanującego systemu pomiarowego *"Wanna"* zbudowanego w naszym laboratorium. Oprogramowanie systemu (zrealizowane w całości przez autora) steruje pracą elektromechanicznego systemu pozycjonowania oraz oscyloskopu cyfrowego służącego do zbierania sygnałów z hydrofonu. Po określeniu parametrów geometrycznych (odległości głowicy od hydrofonu, zakresu skanowania, rastra pomiaru) system automatycznie skanuje zadany obszar dokonując pomiaru szczytowego ciśnienia w każdym punkcie. Dodatkowo korzystano z opcji zapamiętywania całego przebiegu impulsu ciśnienia (dla sygnałów kodowanych).

Rysunek 2.7 przedstawia schemat systemu pomiarowego. Elektromechaniczny system skanujący porusza głowicą zamocowaną w uchwycie w zbiorniku z wodą. Generator arbitralny (LeCroy 9109) służył do wytwarzania przebiegów nadawczych, które po wzmocnieniu we wzmacniaczu mocy (ENI 3100LA) trafiały do głowicy. Po stronie odbiorczej sygnał z szerokopasmowego hydrofonu PVDF (Sonora Sonic 804–201) był wzmacniany w odbiorniku (Ritec BR-640) i trafiał do oscyloskopu cyfrowego (Hewlett-Packard 54503A). Całość sterowania, skanowania i akwizycji sygnału znajduje się pod kontrolą oprogramowania pracującego na komputerze PC. Do badań użyto płaskiej głowicy o częstotliwości 2 MHz, paśmie 50% i średnicy 15 mm.



Rysunek 2.7: Schemat systemu do pomiaru rozkładów pól przetworników ultradźwiękowych

Otrzymane dane służyły do wykreślenia pól ciśnienia (rys. 2.8). Dla pobudzeń sinusoidalnych pole wykreślano na podstawie szczytowej wartości ciśnienia. Dla sygnałów kodowanych pokazano dwa rozkłady pól: pierwszy (fizyczny) pokazujący szczytowe ciśnienia i drugi (wirtualny) pokazujący rozkład dla sygnału po kompresji czasowej. Należy zaznaczyć, że rozkłady wirtualne pola nie mają znaczenia fizycznego jeśli chodzi o wartości amplitudy ciśnienia. Natomiast odpowiadają one polu widzianemu przez system obrazujący wykorzystujący transmisję kodowaną.

Zaobserwowano (rys. 2.8), że kształt pola dla sygnałów kodowanych i nieskompresowanych jest podobny do kształtu pola dla pobudzenia długim sygnałem sinusoidalnym. Natomiast kształt pola wirtualnego dla sygnałów kodowanych przypomina pole dla pobudzenia krótkim impulsem sinusoidalnym. Dla długich sygnałów przestrzenne listki boczne rozkładu są znacznie mniejsze. Dodatkowo procedura kompresji czasowej dała zysk stosunku sygnał/szum na poziomie 19,5 dB dla sygnału chirp, 15,2 dB dla kodu Barkera i 20,5 dB dla kodów Golaya. Najważniejszym wnioskiem przeprowadzonych badań jest potwierdzenie zgodności kształtu przestrzennych rozkładów pola przetwornika dla pobudzeń krótkim impulsem oraz sygnałem kodowanym po dokonaniu kompresji czasowej. Pozwala to na zastosowanie transmisji kodowanej w obrazowaniu i daje możliwość bezpośredniego porównywania obrazów uzyskiwanych przy pomocy różnych sygnałów nadawczych.

Opracowana technika i układ pomiarowy pozwolą na dalsze badania konkretnych przetworników i metod nadawania w celu ich optymalizacji do zastosowań obrazowych.

#### 2.2.4 Podsumowanie

Transmisja kodowana pozwala na zwiększenie energii sygnału, a przez to stosunku sygnał/szum odbieranych ech przy zachowaniu bezpiecznych poziomów nadawania (szczytowego ciśnienia). Niestety jej praktyczna implementacja wymaga poważnych zmian w aparatach oraz dostosowania i optymalizacji metod zaczerpniętych z techniki radarowej.

Badanie, porównanie i optymalizacja sygnałów kodowanych w ultrasonografii wymaga uniwersalnego aparatu, który umożliwia nadawanie arbitralnych sygnałów nadawczych, akwizycję ech w.cz. oraz przetwarzanie cyfrowe za pomocą łatwo modyfikowalnych filtrów dopasowanych i niedopasowanych. Koncepcja tego typu urządzenia została opracowana i zrealizowana w ramach tej pracy.

Zagadnienia zastosowania transmisji kodowanej w technice ultradźwiękowej można podsumować w następujących punktach [125, 87]:

- Specyfika propagacji fal ultradźwiękowych w tkankach biologicznych tłumienie zależne od częstotliwości oraz propagacja nieliniowa, powodują, że skuteczność transmisji kodowanej jest mniejsza niż w zastosowaniach radarowych. Tłumienie powoduje także, że filtracja dopasowana do sygnału nadawczego traci dopasowanie z głębokością, a tym samym możliwy do uzyskania zysk SNR.
- Kody fazowe charakteryzują się nagłymi zmianami fazy, co powoduje, że ich widmo zawiera wysokie harmoniczne, które nie są przenoszone przez przetworniki ultradźwiękowe. Obcięcie tych wysokich składowych widma powoduje, że poziom listków bocznych po kompresji czasowej jest wyższy niż przewidywany teoretycznie.
- Listki boczne są immanentną cechą związaną z transmisją kodowaną i wymagają stosowania metod optymalizacji kształtu widma w celu ich minimalizacji (m.in. filtracji niedopasowanej). Poziom listków dla sygnału chirp jest stosunkowo niezależny od parametru *TB* dla ustalonego kształtu widma, co pozwala na stosowanie jednej metody ich redukcji. Dla kodów fazowych poziom listków bocznych jest funkcją długości kodu. Przy możliwych do zastosowania w ultrasonografii długościach kodów (< 100) oraz ograniczonemu pasmu przetwornika poziom listków bocznych może być zbyt duży do dobrej jakości obrazowania.</li>
- W porównaniu do sygnału chirp kody fazowe są bardzo czułe na efekt Dopplera. Kształt funkcji niejednoznaczności powoduje, że nawet małe przesunięcia częstotliwości powodują znaczący spadek jakości kompresji czasowej. W zastosowaniach obrazowych nieruchomych struktur wpływ efektu Dopplera jest nieistotny.
- Uzyskiwany w transmisji kodowanej zysk sygnał/szum odnosi się do szumu elektronicznego (termicznego), a nie szumu ziarna (speckle). Szum ziarna będący szumem skorelowanym z sygnałem ech jest wzmacniany podobnie jak same echa.



Rysunek 2.8: Rozkłady pól ciśnienia dla różnych pobudzeń kodowanych

# **Rozdział 3**

# Układy i systemy cyfrowego przetwarzania sygnałów

Cyfrowe metody przetwarzania sygnałów coraz częściej wypierają stosowane metody analogowe. Trend ten związany jest z rozwojem technologii półprzewodnikowej. Miniaturyzacja struktur układów scalonych powoduje zwiększenie gęstości upakowania (złożoności) oraz częstotliwości pracy przy jednoczesnym zmniejszeniu napięć pracy, czyli poboru pradu i wydzielanego ciepła. Podejście cyfrowe daje także szersze możliwości przetwarzania (składowania, przesyłania) sygnałów oraz adaptacji algorytmów do szybko zmieniających się potrzeb. Symbolem cyfryzacji świata analogowego jest coraz szersze stosowanie cyfrowego przetwarzania sygnałów w.cz., które do niedawna były "zarezerwowane" dla techniki analogowej. Termin SDR (ang. Software Defined Radio — radio z przetwarzaniem softwarowym) [135] określa konstrukcję systemów radiowych, w których proces modulacji (przy nadawaniu) i demodulacji (przy odbiorze) sygnału radiowego jest realizowany cyfrowo. Jeszcze kilka lat temu takie rozwiązania były niemożliwe technicznie lub nieopłacalne. SDR umożliwia realizację złożonych metod kodowania i modulacji sygnałów oraz możliwości ich adaptacji i zmiany w urządzeniu. Migracja do SDR została spowodowana przez dynamiczny rozwój telekomunikacji bezprzewodowej [128, 32], która wymaga bardzo złożonych metod obróbki sygnału w.cz.. Wiele z cyfrowych metod przetwarzania w telekomunikacji i SDR jest także stosowanych w innych dziedzinach (np. ultrasonografii).

Dalsza część rozdziału jest poświęcona przedstawieniu dostępnych systemów obróbki cyfrowej sygnałów oraz układom przetworników analogowo-cyfrowych. Ze względu na duże zastosowanie przetwarzania cyfrowego w ultrasonografach, wybór sposobu jego realizacji ma znaczący wpływ na konstrukcję całego urządzenia.

# 3.1 Systemy cyfrowego przetwarzania sygnałów

Przetwarzanie cyfrowe sygnałów wymaga układów dopasowujących i przetwarzających sygnał analogowy (przetworniki analogowo-cyfrowe i cyfrowo-analogowe) oraz systemów obliczeniowych wykonujących sam proces obróbki cyfrowej. Systemy przetwarzania cyfrowego ze względu na sposób ich realizacji możemy podzielić na systemy softwarowe (oprogramowanie) oraz hardwarowe (sprzętowe). Generalnie każdy algorytm przetwarzania można zaimplementować w jednej z tych dwóch postaci. Realizacja softwarowa polega na stworzeniu programu realizowanego przez pewien rodzaj procesora (np. procesor sygnałowy, mikrokontroler, itp.). Implementacja hardwarowa jest zrealizowana przez połączenie elementów sprzętowych wykonujących określone, najczęściej proste funkcje (np. bramek logicznych, układów mnożących, itp.). Granica pomiędzy tymi rozwiązaniami zaciera się w programowalnych układach logicznych, w których metody te można dowolnie ze sobą mieszać.

Główną zaletą realizacji softwarowych jest łatwość modyfikacji kodu oraz prostsze metody uruchamiania i debugowania kodu. Implementacje tworzone w jezykach wysokiego poziomu (np. C) moga być łatwo symulowane oraz weryfikowane na różnych platformach, zanim zostana wdrożone na platformie docelowej. Obecnie wiekszość procesorów DSP jest programowanych w języku C oraz posiada zaawansowane narzędzia do kompilacji i uruchamiania kodu. Duża moc obliczeniowa, łatwość tworzenia i modyfikacji wysoko poziomowego kodu powoduje, że procesory DSP czesto stanowia serce przetwarzania w nowoczesnych aparatach. Alternatywnym kierunkiem w przetwarzaniu softwarowym jest wykorzystywanie procesorów ogólnego przeznaczenia. Współczesne procesory komputerów PC dysponuja poteżna moca obliczeniową oraz specjalnymi równoległymi jednostkami wykonawczymi do przetwarzania multimediów. Jednostki te są w istocie osobnymi procesorami wektorowymi zoptymalizowanymi do cyfrowego przetwarzania sygnałów. Umiejetne wykorzystanie przetwarzania równoległego oraz jednostek multimedialnych pozwala zastąpić nawet kilka równolegle pracujących procesorów DSP. Ponieważ komputer PC często stanowi część składową urządzeń, realizując funkcje kontrolera oraz interfejsu użytkownika, implementacja algorytmów przetwarzania na PC wydaje sie naturalna. Problemem w realizacji zadań przetwarzania w czasie rzeczywistym na PC sa systemy operacyjne (np. Windows), które nie sa systemami czasu rzeczywistego i dlatego nie gwarantują precyzji czasowej, ani wykonania wymaganych operacji w ściśle zadanym czasie.

Nowym kierunkiem w przetwarzaniu sygnałów jest wykorzystanie procesorów graficznych GPU (ang. Graphics Processor Unit), które standardowo służą do obsługi funkcji graficznych 3D w komputerach PC. Szybki rozwój grafiki komputerowej spowodował powstanie procesorów graficznych o zupełnie nowych możliwościach. Procesory GPU przeistoczyły się ze specjalizowanych procesorów grafiki 3D w programowalne procesory wektorowe. Dzięki masywnie równoległej architekturze wewnętrznej oraz zaawansowanym interfejsom do pamięci wydajność obliczeń zmiennopozycyjnych układów GPU potrafi 100 krotnie przewyższyć wydajność najszybszych procesorów komputerów PC. Nowe narzędzia programowania procesorów graficznych pozwalają na wykorzystanie tego potencjału obliczeniowego nie tylko do celów graficznych, ale także do realizacji innych zadań [1, 3].

Hardwarowe implementacje cyfrowego przetwarzania sygnałów są obecnie zdominowane przez programowalne układy logiczne (FPGA). Dzięki dostępności tanich odmian układów FPGA są one dzisiaj stosowane nie tylko w produkcji małoseryjnej, ale także w produktach na rynek konsumencki. Możliwość wprowadzania zmian w układzie (także w czasie pracy), bardzo duża rozpiętość gęstości układów (od tysięcy do milionów bramek) oraz coraz bardziej zaawansowane narzędzia projektowe powodują, że układy FPGA zdobywają coraz większą popularność. Metody hardwarowe oferują potencjalnie największą prędkość przetwarzania, ale jednocześnie koszty ich implementacji są najwyższe. Dlatego często metody softwarowe i hardwarowe uzupełniają się wzajemnie, tak aby uzyskać wymaganą wydajność i elastyczność przy minimalizacji kosztów.

Jak widać z powyższych rozważań algorytmy przetwarzania cyfrowego mogą być realizowane w różny sposób i w oparciu o różne rozwiązania. Optymalne wykorzystanie dostępnych środków obliczeniowych oraz architektura systemu, która zapewnia możliwości rozwojowe stanowią bardzo złożony problem naukowy i inżynierski.

# 3.1.1 Programowalne układy logiczne

Pierwsze układy FPGA zostały wprowadzone na rynek przez firmę Xilinx w roku 1985. Architektura układów FPGA została oparta na architekturze matrycy bramek (ang. gate array), która była stosowana do realizacji układów ASIC (ang. Application Specific Integrated Circuits — układów projektowanych na zamówienie). Rynek układów FPGA tworzy obecnie kilku głównych producentów (Xilinx, Altera, Lattice Semiconductor, Actel, Atmel Ouicklogic) oferujac układy o gestościach od kilku tysięcy do milionów bramek i liczbie wyprowadzeń od kilkudziesięciu do ponad tysiąca. Pomimo, że podstawowa komórka logiczna FPGA umożliwia realizację jedynie dość prostych funkcji logicznych, to ich mnogość oraz liczba połaczeń powoduje, że możliwości całego systemu sa ogromne. Rozwój układów FPGA następuje w kierunku realizacji idei SoC (ang. System-on-a-Chip — system w układzie), czyli implementacji całego systemu w jednym układzie scalonym. Dostępnych jest bardzo wiele gotowych bloków funkcjonalnych od najprostszych (np. układów dekoderów, liczników) po bardzo złożone (np. jadra procesorów, bloki szybkich interfejsów). Bloki te sa dostępne albo w postaci wbudowanej w układ przez producenta (tzw. hard-core) lub dostępnych jako bloki zdefiniowane przez matryce połaczeń do wykorzystania w projekcie (tzw. soft-core). Oba rodzaje bloków moga być łaczone w projekcie z logika zdefiniowana przez projektanta tworząc docelowy system. Bloki soft-core, zwane także blokami IP (ang. Intelectual Property — własność intelektualna) sa dostarczane z narzedziami projektowymi FPGA oraz oferowane przez firmy trzecie. Bloki hard-core to najcześciej układy szybkich interfejsów szeregowych (np. PCIe, Ethernet), układy mnożące lub mnożącododające (tzw. bloki DSP), bloki pamięci oraz jądra procesorów. Dużą zaletą bloków hard-core jest ich niewielki koszt (rozmiar w krzemie), duża szybkość działania oraz niski pobór pradu w porównaniu do analogicznego bloku uzyskanego przez soft-core. Z drugiej strony bloki softcore dają znacząco większą elastyczność przy projektowaniu, gdyż można umieścić ich w projekcie tyle ile potrzeba (ograniczeniem jest tylko wielkość struktury). Dostępne obecnie układy, narzędzia i bloki IP umożliwiają budową kompletnych systemów logicznych i mikroprocesorowych tylko przy użyciu układów FPGA, co jest właśnie spełnieniem idei SoC. Przedstawione cechy układów FPGA pozwalają na implementację przy ich pomocy złożonych i jednocześnie elastycznych systemów cyfrowych.

# 3.1.1.1 Architektura wewnętrzna FPGA

Architekturę układów FPGA przedstawiono na przykładzie układów z rodziny Spartan-3 firmy Xilinx (rys. 3.1). Rodzina Spartan-3 produkowana jest w technologii półprzewodnikowej 90 nm i przeznaczona na rynek masowy (niska cena). W tabeli 3.1 podano zestawienie parametrów wybranych układów z rodziny Xilinx Spartan-3. Cała rodzina obejmuje układy od 50 k do 5000 k bramek <sup>1</sup>. Firma Xilinx oferuje także rodzinę układów Virtex zoptymalizowaną pod względem wydajności.

Układ FPGA składa się z matrycy bloków logicznych oraz matrycy połączeń. Zarówno funkcjonalność bloków logicznych, jak i połączeń między nimi jest programowalna. W zależności od stosowanej technologii przełączników, połączenia mogą być ulotne (zanikać po wyłączeniu zasilania) lub nieulotne. Główni producenci (Xilinx, Altera) stosują technologię SRAM (ang. Static Random Access Memory — pamięć statyczna z dostępem swobodnym), w której przełączniki są ulotne i wymagają programowania po każdym włączeniu zasilania. Z drugiej strony, ulotność konfiguracji pozwala na przeprogramowanie układu dowolną liczbę razy, także w trakcie pracy.

 $<sup>^1{\</sup>rm Chodzi}$ o ekwiwalentną liczbę bramek, gdyż układy FPGA nie są faktycznie zbudowane z prostych bramek.





| Model układu              | XC3S200 | XC3S400 | XC3S1000 | XC3S2000 | XC3S4000 |
|---------------------------|---------|---------|----------|----------|----------|
| Bramki logiczne [k]       | 200     | 400     | 1000     | 2000     | 4000     |
| Komórki logiczne          | 4 320   | 8 0 6 4 | 17 280   | 46 080   | 62 208   |
| Bloki mnożące             | 12      | 16      | 24       | 40       | 96       |
| Pamięć blokowa [kb]       | 216     | 288     | 432      | 720      | 1 728    |
| Pamięć rozproszona [kb]   | 30      | 56      | 120      | 320      | 432      |
| Bloki DCM                 | 4       | 4       | 4        | 4        | 4        |
| Liczba sygnałów wej./wyj. | 173     | 264     | 391      | 565      | 712      |

Tabela 3.1: Parametry wybranych układów z rodziny Xilinx Spartan3 [149]

Elementy architektury FPGA (rys. 3.1) [147]:

- **CLB (ang. Configurable Logic Block programowalny blok logiczny)** jest podstawowym elementem architektury układu FPGA powielonym i ułożonym w postaci matrycy. Bloki CLB są połączone w wiersze i kolumny liniami programowalnych połączeń. Pojedynczy blok CLB składa się, w zależności od modelu układu, z 2–4 komórek logicznych ułożonych w dwóch tzw. plastrach (ang. slice).
- LC (ang. Logic Cell komórka logiczna) jest najmniejszym elementem struktury układu składającym się z cztero wejściowego elementu LUT (ang. Look Up Table tablica ko-dująca), układu MUX (ang. Multiplexer multiplekser) oraz rejestru REG (ang. Register rejestr). Element LUT realizuje dowolne funkcje logiczne z czterech sygnałów wejściowych na jeden sygnał wyjściowy. Alternatywnie LUT może realizować funkcje: 16-bitowej pamięci RAM (tzw. pamięć rozproszona) lub 16-bitowego rejestru przesuwnego. Układ MUX pozwala na uzyskanie bardziej złożonych funkcji przez przekierowanie sygnałów wejściowych i wyjściowych w ramach pojedynczej komórki logicznej. Rejestr REG stanowi element pamięciowy na wyjściu komórki logicznej.
- **IOB (ang. Input/Output Block blok wejścia/wyjścia)** jest interfejsem sygnałów wejścia/wyjścia z układu FPGA. Bloki IOB zawierają rejestry (osobne dla wejścia i wyjścia) oraz układy dopasowujące do różnego rodzaju elektrycznych standardów cyfrowych (układ Spartan-3 wspiera 24 standardy!).
- **Układy mnożące** są blokami typu hard-core realizującymi funkcje mnożenia. W układach Spartan-3 układy mnożące wspierają 18-bitowe składniki i zwracają 35-bitowy rezultat. Bloki te są wykorzystywane do realizacji algorytmów cyfrowego przetwarzania sygnałów. W bardziej zaawansowanych układach FPGA (np. Virtex) występują bloki DSP zawierające układy mnożąco-dodające.
- BRAM (ang. Block RAM) blok pamięci jest jednym z dwóch rodzajów pamięci RAM dostępnych w układach FPGA. Pamięć blokowa umożliwia przechowywanie i/lub buforowanie porcji danych bezpośrednio w układzie FPGA (tj. bez konieczności wykorzystywania pamięci zewnętrznej). Pamięć blokowa może pracować w konfiguracji jedno lub dwu portowej. W układach Spartan-3 bloki pamięci mają po 18 kb i mogą pracować w organizacji od 16 k x 1-bit do 512 x 36-bit. Przy pomocy narzędzi projektowych w blokach pamięci mogą być implementowane m.in.: różne konfiguracje pamięci RAM, ROM oraz układy buforowe i kolejkujące. Drugi rodzaj pamięci to pamięć rozproszona, która jest

realizowana w blokach LUT. Ten rodzaj pamięci ma bardzo ograniczoną pojemność ale jest za to równomiernie rozłożony w całej strukturze.

- **DCM (ang. Digital Clock Manager układ zarządzania zegarem)** służy do zarządzania sygnałem zegarowym, w szczególności do mnożenia/dzielenia częstotliwości, opóźniania i synchronizacji fazowej. Funkcje tego typu są zasadniczo realizowane albo przez układy pętli cyfrowych DLL (ang. Delay-Locked Loop) albo pętli fazowych PLL (ang. Phase-Locked Loop). Firma Xilinx stosuje pętle DLL w rodzinie układów Spartan-3.
- **Połączenia programowalne** stanowią siatkę wierszy i kolumn pozwalających na łączenie sygnałów pomiędzy blokami CLB oraz pomiędzy CLB i IOB. Ponieważ połączenia mają bardzo istotny wpływ na opóźnienia sygnałów, od nich w dużej mierze zależy maksymalna prędkość pracy systemu. Dodatkowo w strukturze połączeń są wydzielone specjalne linie o małym opóźnieniu i dużej obciążalności służące do rozprowadzania sygnałów zegarowych.

# 3.1.1.2 Projektowanie układów FPGA

Projektowanie układów FPGA jest procesem złożonym wymagającym znajomości architektury układu, narzędzi projektowych oraz metodologii projektowania. Wstępnym etapem projektowym, po określeniu wymagań systemu, jest wybór docelowego układu, który zależy od wielu czynników, a w szczególności [36]:

- złożoność projektu (szacowana wielkość potrzebnych zasobów logicznych),
- specyficzne wymagania dotyczące bloków hard-core (np. bloki DSP),
- wymagana częstotliwość pracy logiki oraz sygnałów wej./wyj.,
- rodzaj, liczba i standardy interfejsów wej./wyj.,
- wymagania dotyczące liczby, częstotliwości i typów sygnałów zegarowych,
- wymagania zasilania (pobór prądu, liczba napięć),
- wybór i możliwości narzędzi projektowych oraz dostępność bloków IP,
- typ obudowy mający wpływ na projekt płyty drukowanej i jej montaż (np. możliwość migracji do większych układów w tej samej obudowie).

Przebieg procesu implementacji projektu w układzie FPGA przedstawiono na rysunku 3.2. Narzędzia projektowe standardowo akceptują na wejściu opis układu w postaci schematu ideowego lub w jednym z języków HDL (ang. Hardware Description Language — język opisu sprzętu). Projektowanie za pomocą języków HDL staje się coraz powszechniejsze i powoli wypiera schematy, które w przypadku bardziej złożonych projektów stają się trudne do utrzymania. W narzędziach do układów FPGA wspierane są obecnie dwa języki HDL: Verilog i VHDL. Oba są językami wysokiego poziomu umożliwiającymi opis układów na różnym poziomie abstrakcji — od bramek i logiki po algorytmy i systemy. VHDL posiada więcej konstrukcji wysokiego poziomu (biblioteki, pakiety, konfiguracje) i wsparcia dla modelowania i symulacji systemów.



Rysunek 3.2: Metodologia projektowania układów FPGA (na podstawie [147])

Pierwszy etap (synteza) polega na przetłumaczeniu wejściowego opisu układu na poziom RTL (ang. Register Transfer Level — poziom przesłań międzyrejestrowych). Poziom RTL, to uniwersalny opis układów cyfrowych za pomocą zbioru rejestrów, logiki kombinacyjnej oraz przesłań pomiędzy rejestrami. Na tym etapie możliwa jest symulacja funkcjonalna systemu polegająca na weryfikacji odpowiedzi układu na zadane pobudzenia testowe. Wejściem do procesu implementacji w FPGA jest opis na poziomie RTL. Kolejne kroki (translacja i mapowanie) polegają na przetłumaczeniu tego opisu na funkcje realizowalne w danym typie układu FPGA. Na tym etapie powstaje nowa reprezentacja systemu wykorzystująca elementy FPGA. Umieszczanie i łaczenie (ang. PAR – Palce & Route) to najbardziej pracochłonny etap implementacji polegający na układaniu elementów logiki w konkretnym miejscu układu (komórkach logicznych) i ich łączeniu zgodnie ze schematem (reprezentacją po etapie mapowania). W zależności od stopnia skomplikowania układu, dostępnych zasobów połączeniowych, rozkładu wyprowadzeń oraz nałożonych ograniczeń czasowych proces ten może trwać od kilku sekund do wielu godzin (!). Algorytmy PAR opierają się na metodach heurystycznych i nie mają ograniczonego czasu działania ani zagwarantowanej zbieżności rozwiązania. Optymalny rozkład logiki i sieci połączeń powinien zagwarantować spełnienie narzuconych wymagań na czasy propagacji sygnałów cyfrowych przez układ, czyli innymi słowy na prędkość pracy systemu. Czas propagacji sygnału przez układ składa się z czasu propagacji przez komórki logiczne oraz połączenia między nimi. Stopień złożoności funkcji logicznej jest charakteryzowany przez tzw. liczbe poziomów logiki, czyli liczbe komórek logicznych potrzebnych do jej realizacji. Większa liczba poziomów logiki przekłada się bezpośrednio na prędkość realizacji funkcji i ogranicza całkowita predkość systemu. Statyczna analiza czasowa przeprowadzana po etapie translacji pozwala na wstępne oszacowanie wydajności systemu na podstawie analizy liczby poziomów logiki

dla poszczególnych sygnałów. Narzędzia projektowe posiadają wiele zaawansowanych funkcji służących otrzymaniu optymalnej implementacji w możliwie najkrótszym czasie. Projektant może także wpływać na proces rozkładu logiki w układzie przez ręczne umieszczanie pewnych części projektu w określonych blokach logicznych. Umieszczenie związanych ze sobą funkcji systemu w sąsiadujących blokach jest najczęściej dobrym rozwiązaniem, bo minimalizuje długość połączeń między nimi, a co za tym idzie czas propagacji. Z drugiej strony narzucenie więzów może spowodować, że narzędzie nie będzie w stanie znaleźć optymalnego rozwiązania, które zostałoby znalezione przy innym ułożeniu elementów. Po zakończeniu etapu PAR znany jest już dokładny projekt wnętrza układu FPGA i może być przeprowadzana symulacja czasowa uwzględniająca czasy opóźnień wszystkich sygnałów zarówno w logice, jak i w połączeniach.

Zakończeniem procesu implementacji jest generowanie, czyli pliku binarnego służącego do programowania układu — tzw. bitstreamu. Układy FPGA są najczęściej programowane w układzie za pomocą interfejsu JTAG (ang. Joint Test Action Group), który może też pełnić inne funkcje testowe. Dla układów z ulotną konfiguracją stosuje się zewnętrzne pamięci Flash lub zewnętrzny kontroler (np. mikroprocesor). Choć weryfikacja działania układu jest możliwa w docelowym układzie, to w praktycznych systemach niezwykle trudna przez kłopotliwy dostęp do wyprowadzeń układów oraz trudności związane z obserwacją szybkich sygnałów cyfrowych. Dostępne są specjalizowane rozwiązania (np. Xilinx ChipScope Pro), które pozwalają na obserwację dowolnych sygnałów (zarówno zewnętrznych, jak i wewnętrznych) układu FPGA i ich odczyt przez interfejs JTAG. Narzędzia te zajmują pewne zasoby w układzie FPGA, gdzie po spełnieniu zadanych warunków są zapamiętywane stany wybranych sygnałów.

Realizacja projektu FPGA jest procesem iteracyjnym, w którym weryfikacja jest przeprowadzana na kolejnych etapach implementacji. Symulacja funkcjonalna już na samym początku pozwala na sprawdzenie poprawności projektu bez konieczności jego czasochłonnej implementacji. Symulacja na kolejnych etapach daje odpowiedź na pytanie, czy poprawny funkcjonalnie projekt zachowuje się identycznie po implementacji i czy spełnia wymagania czasowe.

**Alternatywne narzędzia projektowe** Opis układów cyfrowych w językach HDL różni się znacząco od sposobu opisu algorytmów za pomocą języków wysokiego poziomu (np. C) używanych standardowo do programowania. Możliwość kompilacji z języka C do sprzętu daje dużo korzyści — m.in. możliwość programowania FPGA przez programistów, łatwość przenoszenia algorytmów komputerowych na FPGA oraz ułatwioną weryfikację i symulację. Dlatego, w ostatnich latach powstały narzędzia (Impulse C, Spec-C, Handel-C, SystemC) pozwalające na syntezę bezpośrednio z języka C [117]. Rozwiązania te umożliwiają syntezę jedynie z ograniczonego kodu C (np. wymagają stosowania określonych typów lub bibliotek), ale i tak jest to znaczące ułatwienie w stosunku do języków HDL. Kod w języku C jest tłumaczony na język HDL, a następnie syntezowany w sposób identyczny z opisanym w poprzednim paragrafie. Dodatkowo tworzony jest kod dla procesora, uzupełniony o model interfejsu cyfrowego w celu symulacji i weryfikacji algorytmu na komputerze. Czasy symulacji kodu w języku C na komputerze są znacząco (10–1000x) krótsze w porównaniu do symulacji reprezentacji RTL.

Jeszcze inne podejście do zagadnienia projektowania FPGA reprezentuje narzędzie *System Generator for DSP* firmy Xilinx [150]. Oferuje ono budowanie modeli w systemie Simulink środowiska MATLAB oraz ich bezpośrednią symulację cyfrową i syntezę. Projektant buduje schemat systemu korzystając z dostarczonych bloków realizujących wysokopoziomowe funkcje DSP (np. generator, filtr, sumator, itp.). Następnie może przeprowadzić jego symulację w środowisku graficznym Simulink dla zadanych pobudzeń i sprawdzić poprawność algorytmu. Zweryfikowany projekt może być automatycznie syntezowany na dany układ FPGA. Bloki

DSP z systemu Simulink są zastępowane przygotowanymi blokami IP (soft-core) realizującymi te funkcje w układzie FPGA. System Generator pozwala na implementację bardzo złożonych algorytmów przetwarzania cyfrowego w bardzo krótkim czasie.

**Sprzętowe zagadnienia projektowania FPGA** Poza opisaną powyżej softwarową stroną projektowania FPGA, nie mniej ważna jest strona sprzętowa (elektroniczna). Poniżej przedstawiono hasłowo najważniejsze zagadnienia:

- Zasilanie układów FPGA jest jednym z krytycznych elementów systemów cyfrowych. Nowoczesne układy wymagają kilku różnych napięć zasilania do poprawnej pracy (np. 1,2 V, 2,5 V oraz 3 V, dla układów Spartan-3). Napięcia te muszą spełniać ostre wymogi stabilności w szerokim zakresie pobieranych prądów, co jest związane z dynamicznym obciążeniem jakim są układy cyfrowe. Linie zasilania muszą spełniać dodatkowe warunki przy włączaniu systemu: kolejność włączania, monotoniczność i szybkość wzrostu napięcia. Równie duże znaczenie ma doprowadzenie zasilania do samego układu. Ze względu na nieustannie rosnące prędkości pracy tych układów propagacja sygnałów (w tym zasilania) wkracza w zakres techniki wysokich częstotliwości. Indukcyjności doprowadzeń zasilania do układu stają się istotnym problemem ograniczającym szybkość pracy. Wielowarstwowe płyty drukowane oraz optymalizowane sieci kondensatorów filtrujących (odblokowujących) zasilanie stanowią narzędzie w walce z tymi niepożądanymi efektami.
- Integralność sygnałów jest związana z propagacją bardzo szybkich sygnałów cyfrowych po ścieżkach płyty drukowanej, kablach i złączach. Szerokość widma częstotliwości sygnałów cyfrowych nie tyle zależy od częstotliwości samego sygnału ile od prędkości ich narastania. Z tego powodu technika cyfrowa już dawno wkroczyła w zakres częstotliwości gigahercowych. Integralność sygnału cyfrowego, to wymóg poprawnej interpretacji sygnału 0/1 po jego przejściu ze źródła do odbiornika. Zapewnienie dobrej propagacji sygnałów cyfrowych wymaga dzisiaj stosowania technik w.cz. np.: dopasowanie impedancji nadajnik/odbiornik, kontrolowana impedancja ścieżek obwodu drukowanego, itp.. Integralność jest także związana z jakością układów zasilania (o czym była mowa poprzednio) oraz zagadnieniami kompatybilności elektromagnetycznej. Promieniowanie zakłóceń wywołanych prądami w.cz. w układach FPGA może powodować zakłócanie innych urządzeń i/lub zmniejszać odporność systemu na zakłócenia z zewnątrz.
- Zagadnienia termiczne odprowadzanie ciepła i monitorowanie temperatury pracy układów FPGA ma na celu umożliwienie pracy w określonym zakresie temperatur systemu oraz zwiększenie niezawodności w zastosowaniach krytycznych. Pobór prądu i wydzielanie ciepła w układach FPGA są bardzo dynamiczne i zależą nie tylko od częstotliwości pracy ale także od projektu (wykorzystania zasobów wewnętrznych).

## 3.1.1.3 Zastosowania FPGA

Układy FPGA były początkowo stosowane głównie jako logika łącząca (tzw. glue-logic) różne elementy systemów i interfejsów. Z czasem dzięki coraz większym gęstościom układów, integracji specjalizowanych bloków (np. DSP) oraz dostępności nowych narzędzi przekształciły się w dzisiejsze samowystarczalne systemy (SoC). Ważnym krokiem na drodze rozwoju zastosowań układów FPGA była popularyzacja bloków wbudowanych procesorów oraz bloków DSP. Bloki procesorów (soft-core i hard-core) umożliwiły budowę kompletnych systemów przetwarzania bez potrzeby stosowania dodatkowych układów procesorowych. Układy FPGA są obecnie główną platformą do hardwarowej realizacji obliczeń i cyfrowego przetwarzania sygnałów. Ogromna dostępna przepustowość interfejsów cyfrowych oraz duża liczba bloków obliczeniowych predysponuje je do strumieniowego przetwarzania danych z dużą prędkością/częstotliwością. Ze względu na wyższe koszty implementacji algorytmów w FPGA są one stosowane tam gdzie prędkość strumienia danych przekracza możliwości procesorów DSP (telekomunikacja, obróbka video, radio cyfrowe, etc.). Układy FPGA często stanowią pierwszy stopień przetwarzania realizujący wstępną obróbkę i redukcję prędkości strumienia danych (np. przez decymację).

Sumaryczna wydajność obliczeniowa układów FPGA jest wynikiem przemnożenia wydajności pojedynczego bloku przez ich liczbę. W przypadku klasycznych systemów (procesorów) wydajność nie rośnie w tak prosty sposób, gdyż ograniczeniem są interfejsy do pamięci oraz komunikacja wewnętrzna. Dostępna przepustowość bloków wej./wyj. układów FPGA potencjalnie umożliwia pracę bloków obliczeniowych z pełną prędkością. Oczywiście w konkretnym rozwiązaniu inne czynniki lub interfejsy mogą ograniczać przepustowość. Duży wpływ na wydajność obliczeń ma także sposób implementacji algorytmów. Procesory DSP realizują filtry cyfrowe w sposób szeregowy korzystając z wbudowanego układu mnożąco-dodającego. Czas wykonywania operacji filtracji zależy od liczby współczynników filtru. W układach FPGA dzięki dostępności dużej liczby bloków obliczeniowych możliwa jest implementacja w pełni równoległa, przy której czas filtracji nie zależy od liczby współczynników (operacja filtracji wykonywana jest w jednym cyklu — równolegle) [84].

Wymagane moce przetwarzania dla przykładowych zastosowań oraz wydajności układów FPGA Xilinx z rodziny Spartan-DSP i Virtex-DSP zestawiono na rysunku 3.3. O możliwościach obliczeniowych FPGA niech świadczy fakt, że największy obecnie dostępny układ z rodziny Virtex-5 SXT zawierający 640 specjalizowanych bloków DSP może osiągnąć moc przetwarzania do 352 GMAC/s. Układy FPGA są także wykorzystywane jako akceleratory obliczeń w uniwersalnych oraz specjalizowanych systemach komputerowych. Przykładem jest superkomputer Cray XD1 zbudowany w oparciu o procesory AMD Opteron z modułem akceleratora na układach Xilinx Virtex [38].

Ograniczając się do aplikacji w aparatach ultradźwiękowych obecne zastosowania układów FPGA obejmują:

- realizację układów beamformerów dla głowic wieloelementowych,
- układy przetwarzania sygnału video (filtracja, nakładanie palety kolorów, etc.),
- filtrację i przetwarzanie sygnału w.cz.,
- układy konwersji geometrii (scan-converter),
- systemy kompresji i składowania obrazów medycznych,
- systemy rejestracji i fuzji danych z różnych systemów diagnostycznych.

## 3.1.2 Procesory sygnałowe

Układy DSP są specjalizowanymi procesorami do przetwarzania sygnałów cyfrowych. Architektura wewnętrzna tych układów różni się od procesorów ogólnego przeznaczenia. Najważniejszymi wyróżnikami układów DSP są:

• architektura pamięci z rozdzieloną magistralą danych i rozkazów (nie we wszystkich układach),



Rysunek 3.3: Wydajność bloków DSP układów Xilinx oraz ich aplikacje [152]

- szybkie jednostki obliczeniowe typu MAC (mnożąco-dodające) będące podstawą większości algorytmów przetwarzania cyfrowego,
- układy saturacji obliczeń istotne dla zapewnienia poprawności obliczeń w przypadkach nadmiaru/niedomiaru,
- instrukcja pętli bez narzutu (ang. zero-overhead loop) wykonanie operacji skoku w pętli nie zajmuje czasu procesora, co jest istotne dla algorytmów filtracji pracujących w pętli,
- specjalne tryby adresowania pamięci umożliwiające realizację buforów cyklicznych.

Wszyscy najwięksi producenci układów DSP (Texas Instruments, Freescale, Analog Devices) oferują procesory z arytmetyką stałopozycyjną i/lub zmiennopozycyjną. Procesory zmiennopozycyjne ułatwiają implementację algorytmów DSP, szczególnie dla sygnałów o dużej dynamice (np. zastosowania audio), minimalizując niebezpieczeństwa związane z przepełnieniem w trakcie obliczeń i uwalniając od konieczności skalowania wyników na poszczególnych etapach obliczeń. Procesory stałopozycyjne operują na słowach 8–32 bitów (w zależności od modelu) i oferują większą wydajność obliczeń.

Na rynku dostępne są procesory DSP o częstotliwościach pracy od 50 MHz do ponad 1 GHz i pokrywające szeroką paletę zastosowań. Układy DSP oferują dużą moc obliczeniową przy stosunkowo niewielkim poborze prądu dlatego są często stosowane w systemach wbudowanych i przenośnych. Dostępne narzędzia programistyczne umożliwiają programowanie układów DSP w języku C i dysponują gotowymi bibliotekami zoptymalizowanych funkcji do przetwarzania cyfrowego (funkcje filtracji, FFT, itp.). Procesory DSP pracują najczęściej w reżimie czasu rzeczywistego, co ma duże znaczenie w wielu zastosowaniach. W ostatnich latach można zaobserwować trend do unifikacji architektury procesorów DSP i ogólnego przeznaczenia. Powodem tego jest rozwój zastosowań multimedialnych (audio i video), które wymagają szybkiego przetwarzania cyfrowego. Coraz więcej procesorów ogólnego przeznaczenia jest wyposażonych w układy akceleracji DSP (od prostych układów MAC, po specjalizowane systemy koprocesorów wektorowych). Możliwości tych układów zostały przedstawione w rozdziale 3.1.3.

# 3.1.2.1 Architektura DSP

Na rynku dostępnych jest wiele modeli i architektur układów DSP zoptymalizowanych do różnych zastosowań. Dla przykładu przedstawiono architekturę procesorów DSP z rodziny TMS320C64x firmy Texas Instruments, które są stosowane przez producentów ultrasonografów m.in. Esaote i Zonare. Układy te należa do najwydajniejszych układów stałopozycyjnych dzieki wysokiej czestotliwości pracy (do 1 GHz) oraz równoległym jednostkom wykonawczym mogacym realizować do ośmiu operacji w jednym cyklu zegara — co daje szczytowa wydajność obliczeń na poziomie 8 GMAC/s dla danych 16-bitowych. Procesory TMS320C64x sa zbudowane w oparciu o jadro procesora C64x+ oraz wyposażone w dodatkowe urządzenia peryferyjne. Mikroarchitektura jadra C64x+ (rys. 3.4) składa sie z ośmiu jednostek wykonawczych (.L1, .S1, .M1, .D1, .L2, .S2, .M2, .D2), dwóch plików 32-bitowych rejestrów (po 32 każdy), kontrolera przerwań oraz pamięci podręcznej i układów zarządzania pamięcią (UMC, DMC, EMC) [140]. Jądro procesora C64x+ posiada rozbudowany podsystem pamięci składający się z osobnych pamięci podręcznych danych i programu oraz zestawu połączonych kontrolerów pamięci. Duża wydajność obliczeń wymaga zapewnienia odpowiedniej przepustowości pamieci do danych oraz wykonywanego programu. Procesor korzysta ze zunifikowanej pamięci zewnętrznej (danych i programu) obsługiwanej przez kontroler EMC. Wewnętrzne kontrolery pamięci: programu, danych oraz wspólnej (PMC, DMC, UMC) mogą pobierać dane z pamieci zewnetrznej za pomoca układu IDMA (ang. Internal Direct Memory Access — wewnetrzny układ bezpośredniego dostepu do pamieci). Układy DMA pozwalają na realizacje transferu danych pomiedzy pamieciami bez udziału procesora, który może w tym czasie wykonywać inne operacje. Każdy z bloków wykonawczych może wykonywać jedna operacje w cyklu zegara. Bloki .M wykonuja funkcje mnożenia i dodawania na liczbach 8, 16 i 32-bitowych, bloki .L to jednostki arytmetycznologiczne natomiast bloki .D odpowiadają za transfer danych z/do pamieci. Mikroarchitektura C64x+ wykorzystuje liste instrukcji z bardzo długim słowem tzw. VLIW (ang. Very Long Instruction Word) [66]. Podobnie jak w przypadku procesorów superskalarnych (rozdział 3.1.3) architektura VLIW wykorzystuje równoległość na poziomie wykonywania instrukcji. Jednak w przypadku VLIW optymalizacja i przydział instrukcji do jednostek wykonawczych jest realizowany na etapie kompilacji kodu, a nie przez sam procesor. Każda ze 256-bitowych instrukcji zawiera pod-instrukcje dla każdego z ośmiu bloków wykonawczych, co umożliwia równoległe wykonywanie wielu operacji. Ponieważ pisanie programów wykorzystujących optymalnie wszystkie jednostki przy jednoczesnym uwzględnieniu zależności danych jest niezwykle trudne, stosuje się specjalizowany kompilator języka C, który wyręcza w tym programistę. Dodatkowo producent dostarcza wygodne narzędzia uruchomieniowe oraz wydajne biblioteki funkcji DSP.

# 3.1.2.2 Zastosowania DSP

Układy DSP są bardzo szeroko stosowane w urządzeniach ultrasonograficznych. W zależności od budowy aparatu procesory DSP mogą stanowić główny system przetwarzania lub realizować jedynie niektóre funkcje przetwarzania (np. dopplera kolorowego). Ze względu na wymaganą



Rysunek 3.4: Budowa jądra procesora sygnałowego z rodziny C64+ firmy Texas Instruments (na podstawie [140])

moc przetwarzania cyfrowego układy DSP są często wspierane układami FPGA. Firma Zonare w swoim flagowym modelu ultrasonografu *z.one* stosuje kombinację układów FPGA oraz DSP do realizacji całego toru przetwarzania cyfrowego i wizualizacji. Aparat *z.one* zawiera trzy procesory TMS320C6455 pracujące z zegarem 1 GHz i wyposażone w 128 MB pamięci zewnętrznej każdy [82]. Dodatkowo układ FPGA Xilinx Virtex-4 XC4VSX55 FPGA z 256 MB pamięci stanowi interfejs pomiędzy zestawem przetworników analogowo-cyfrowych, a procesorami DSP. Wydajny układ wbudowanego kontrolera Freescale MPC5200 z pamięcią 256 MB odpowiada za realizację funkcji sterująco-kontrolnych i wyświetlania. Dzięki dużej skali integracji cały aparat jest w pełni przenośny (waga poniżej 3 kg) i umożliwia pracę na akumulatorach do 1,5 h (ok. 30 W pobieranej mocy).

# 3.1.3 Procesory uniwersalne

Współczesne procesory uniwersalne GPP (ang. General Purpose Processor — procesor ogólnego przeznaczenia) i mikrokontrolery są produkowanymi masowo układami cyfrowymi znajdującymi zastosowanie w komputerach PC i systemach wbudowanych.

Większość obecnie produkowanych procesorów ogólnego przeznaczenia jest opartych na mikroarchitekturze RISC (ang. Reduced Instruction Set Computer — komputer o zredukowanej liście instrukcji), która została określona w latach 1970. Architektura RISC powstała jako alternatywa do rozpowszechnionych wtedy procesorów CISC (ang. Complex Instruction Set Computers — komputer ze złożoną listą instrukcji) i miała na celu uproszenie budowy wewnętrznej, zwiększenie częstotliwości pracy oraz osiągnięcie wykonywania jednej instrukcji w jednym cyklu zegara. Cechami wyróżniającymi procesory RISC są:

- Stała długość słowa rozkazowego, która ułatwia jego pobieranie i dekodowanie. Ortogonalna lista instrukcji — brak powielania funkcjonalności pomiędzy instrukcjami.
- Sprzętowa realizacja wykonywania instrukcji zamiast mikrokodu i wykonywania wieloetapowego znanego z procesorów CISC. Sprzętowa implementacja prostszego zestawu instrukcji wymaga mniej powierzchni krzemu, co przekłada się na mniejszą cenę i pobieraną moc.
- Architektura load/store (ładuj/zachowaj) polegająca na realizacji operacji arytmetycznologicznych na danych znajdujących się w rejestrach, a nie bezpośrednio w pamięci danych. Pozwoliło to na rozdzielenie instrukcji dostępu do pamięci od instrukcji realizujących obliczenia.
- Duża liczba uniwersalnych rejestrów, w odróżnieniu od mniejszej liczby specjalizowanych rejestrów w architekturze CISC.
- Implementacja potokowa, która polega na podziale na etapy pobierania, dekodowania i wykonywania instrukcji, w celu skrócenia czasu potrzebnego na realizację pojedynczego etapu, a tym samym zwiększenia częstotliwości pracy układu.
- Uproszczony podsystem pamięci mała liczba trybów adresowania pamięci, brak (lub małe) wsparcie dla adresowania danych mniejszych od szerokości słowa instrukcji.

Mikroarchitektura RISC okazała się dobrą podstawą do rozwoju i zwiększania wydajności procesorów poprzez ILP (ang. Instruction Level Parallelism — równoległość na poziomie instrukcji). Potokowa implementacja wykonywania instrukcji pozwoliła uzyskać realizację jednej

instrukcji w jednym cyklu zegara. Zauważono, że dzięki zastosowaniu kilku jednostek wykonawczych można zwiększyć liczbę wykonywanych instrukcji w cyklu zegarowym bez zmiany listy instrukcji — tak powstała architektura superskalarna. Procesory superskalarne pobierają większą liczbę instrukcji i automatycznie przydzielają je do wolnych jednostek wykonawczych umożliwiając ich pracę równoległą. Algorytm tego przydziału musi uwzględniać zależności pomiędzy instrukcjami oraz ich rezultatami, tak aby była zachowana sekwencyjność wykonywania instrukcji. Ograniczenia techniki superskalarnej wynikają z ograniczonej liczby równoległych instrukcji znajdujących się blisko siebie w strumieniu instrukcji programu oraz złożoności związanej z implementacją układu rozdzielania instrukcji i uwzględniania zależności pomiędzy nimi.

Wydajność procesorów jest określona przez częstotliwość pracy oraz liczbę instrukcji wykonywanych w jednym cyklu zegara:

#### *Wydajność* = (*Częstotliwość pracy*) · (*Liczba instrukcji wykonywana w cyklu zegara*).

W latach 1986–2002 wydajność procesorów rosła z prędkością ok. 1,5 raza rocznie, jednocześnie wzrost wydajność pamięci RAM w tym samym czasie wyniósł ok. 1,07 raza rocznie [60]. Stały wzrost wydajności był możliwy dzięki rozwojowi technologii półprzewodnikowej umożliwiającej wzrost częstotliwości pracy oraz stopień integracji układów (złożoność). Jednak na początku lat 2000 okazało się, że możliwości dalszego rozwoju w oparciu o równoległość na poziomie instrukcji oraz zwiększanie częstotliwości pracy są ograniczone. Dalsze zwiększanie częstotliwości pracy powodowało proporcjonalny wzrost pobieranej mocy, ale przestało przynosić odpowiedni wzrost wydajności. Załamanie obowiązującego dotychczas prawa skalowania częstotliwości było spowodowane napotkaniem tzw. ściany ILP oraz ściany pamięci. Ściana ILP, to kres możliwości dalszego eksploatowania równoległości w strumieniu instrukcji programu. Ściana pamięci związana jest z przepaścią powstałą pomiędzy prędkościami przetwarzania procesorów, a wydajnością pamięci (prędkością i opóźnieniami). Oba te ograniczenia spowodowały, że jednostki procesora nie są w pełni wykorzystywane, gdyż nie może on zrównoleglić odpowiedniej liczby instrukcji i/lub musi czekać na nowe instrukcje z pamięci.

Zaczeto poszukiwać nowych sposobów zwiększenia wydajności oraz równoległości w systemach komputerowych. Równoległość realizacji programów była implementowana w systemach operacyjnych od samego początku (Unix — 1970) przez podział czasu procesora. Emulacja równoległości w systemach jednoprocesorowych opiera się na przydzielaniu krótkich odcinków czasu (1-50 ms) po kolei każdemu z działających programów. Systemy wieloprocesorowe — składające się z kilku procesorów, zapewniają prawdziwą równoległość wykonywania programów. Współczesne systemy operacyjne (Windows, Linux) oferują także możliwość tworzenia watków (ang. threads) wykonywanych równolegle zadań w ramach jednego procesu. Taka logiczna równoległość ułatwia tworzenie pewnych aplikacji i może przyczynić się do lepszego wykorzystania wydajności procesora, gdyż procesy/wątki oczekujące (np. na dane) są blokowane i nie zajmują czasu procesora. Wykorzystanie równoległości na poziomie watków TLP (ang. Thread Level Parallelism) stało się obowiązującym kierunkiem od roku 2005, kiedy zaczęły się pojawiać procesory z dwoma jądrami umieszczonymi w jednej strukturze krzemowej (AMD Opteron, Intel Pentium D, Intel Core Duo). Powstały także bardziej egzotyczne architektury np: Sun UltraSPARC T1 składający się z 8 jąder (jednostek wykonawczych) i wsparciem dla 32 równoległych watków, czy procesor Cell opracowany przez alians firm Sony, Toshiba i IBM, zawierający 9 jąder.

Należy wspomnieć, że następująca obecnie migracja do procesorów opartych na TLP wymaga także opracowania nowych metodologii i języków programowania, które pozwolą na optymalne wykorzystanie nowych architektur. Tworzenie oprogramowania wielowątkowego jest trudne ze względu na zagadnienia podziału zadań na wątki, współdzielenia danych między wątkami oraz ich synchronizacji. Obecnie stosowane są klasyczne rozwiązania znane z programowania systemów klastrowych i superkomputerów, jak np.: MPI (ang. Message Passing Interface) lub OpenMP (ang. Open Multi-Processing). System MPI [50] służy do programowania i uruchamiania aplikacji w środowisku rozproszonym z medium komunikacyjnym (systemy klastrowe, systemy heterogeniczne). Współdzielenie danych oraz synchronizacja jest realizowana w MPI za pomocą przesyłania komunikatów pomiędzy węzłami (procesorami) w systemie. MPI wymaga explicite określania równoległości fragmentów programu oraz synchronizacji. OpenMP [2] przeznaczony jest dla maszyn ze współdzieloną pamięcią. Specjalne dyrektywy OpenMP pozwalają kompilatorom na automatyczne zrównoleglanie określonych fragmentów programu.

Niezależnym kierunkiem rozwoju jest równoległość oparta o dane — DLP (ang. Data Level Parallelism). Tego typu podejście jest stosowane w procesorach graficznych GPU (rozdział 3.1.4) oraz w specjalizowanych jednostkach wektorowych będących elementem wielu procesorów uniwersalnych (opisanych poniżej).

#### 3.1.3.1 Jednostki wektorowe

Jednostki wektorowe pojawiły się pierwotnie w procesorach uniwersalnych jako jednostki wspomagające przetwarzanie multimediów. Jednostki te są oparte na technice SIMD (ang. Single Instruction Multiple Data — pojedyncza instrukcja wiele danych), czyli wykonywaniu pojedynczej instrukcji/operacji na wektorze danych równocześnie (stąd ich nazwa) [37]. Jednymi z pierwszych zaimplementowanych rozszerzeń wektorowych były: VIS (Visual Instruction Set) opracowany przez Sun Microsystems w 1995 dla procesorów SPARC, MMX z 1997 dla procesorów Intel x86 oraz AltiVec wdrożony w 1999 przez Apple, IBM i Motorola do procesorów PowerPC. Produkowane w największej liczbie procesory z rodziny x86 (Intel, AMD) są obecnie wyposażone w czwartą wersję jednostek SIMD pod nazwą SSE4 (ang. Streaming SIMD Extensions — strumieniowe rozszerzenia SIMD). Rozszerzenia SSE4 wykonują operacje na rejestrach 128-bitowych mogących zawierać wektory 8/16/32/64-bitowych liczb całkowitych lub 32/64-bitowych liczb zmiennopozycyjnych. Poza standardowymi instrukcjami arytmetycznymi i logicznymi rozszerzenia SSE4 zawierają specjalizowane instrukcje wspomagające algorytmy kompresji/dekompresji strumieni audio-wideo, przetwarzania grafiki 3D oraz operacji na łańcuchach znaków [64].

Technika SIMD pozwala na wykorzystanie równoległości na poziomie danych, która polega na zwiększeniu wydajności przez realizację obliczeń na kilku danych równocześnie. Przetwarzanie strumieni danych multimedialnych zawierających wideo (będące z natury wielokanałowe, ponieważ zawiera trzy kolory opisujące piksel obrazu) oraz wielokanałowe audio jest głównym kandydatem do stosowania tej technologii.

Realizacja ogólnych algorytmów przetwarzania cyfrowego na jednostkach wektorowych procesorów GPP jest obecnie ułatwiona dzięki dostępnym zoptymalizowanym bibliotekom funkcji numerycznych. Przykładem jest biblioteka Intel IPP (Integrated Performance Primitives) [138] dostępna dla procesorów z rodziny x86 i systemów operacyjnych: Windows, Linux, Mac OS. Biblioteka IPP zawiera następujące grupy funkcji:

• przetwarzania sygnałów (funkcje filtracji, FFT, przetwarzanie audio, operacje na wektorach, kodowanie, etc.),

- przetwarzania obrazów i wideo (filtracja obrazu, transformacje koloru, liniowe i geometryczne, kodowanie, etc.),
- operacje macierzowe (algebra wektorowa i macierzowa, systemy równań linowych, etc.),
- kryptografia (funkcje szyfrowania, generacji kluczy, etc.).

Biblioteka jest wyposażona w funkcję automatycznego ładowania optymalnych implementacji funkcji w zależności od modelu procesora na którym jest wykonywana. Możliwa do uzyskania wydajność przetwarzania cyfrowego przy użyciu biblioteki IPP jest bardzo wysoka (znacznie przekracza wydajność dostępnych jednoukładowych procesorów DSP). W połączeniu z łatwością tworzenia i uruchamiania oprogramowania na standardowym komputerze PC wykorzystanie jednostek wektorowych jest bardzo ciekawą opcją dla realizacji cyfrowego przetwarzania sygnałów. Oczywiście należy pamiętać, że wysoka wydajność wiąże się z bardzo wysoką wydzielaną mocą procesora (50–150 W), co eliminuje go z niektórych zastosowań. Inną przeszkodą jest trudność zapewnienia przetwarzania w reżimie czasu rzeczywistego (często wymaganego w zastosowaniach DSP) pod kontrolą standardowych systemów operacyjnych.

# 3.1.4 Procesory graficzne

Rozwój systemów graficznych komputerów PC jest obecnie niezwykle dynamiczny. Początkowo układy graficzne służyły jedynie do wyświetlania grafiki 2D i nie posiadały żadnych układów wspierających — wszystkie operacje rysowania były realizowane przez procesor główny komputera [47]. Następnie pojawiły się akceleratory grafiki 2D realizujące funkcje rysowania linii, obsługi kursorów oraz operacji kopiowania pamięci (ang. BitBLT). Od roku 1995 zaczęły się pojawiać pierwsze układy z akceleracją grafiki 3D np.: S3 ViRGE, 3dfx Voodoo, ATI Rage. W tych układach akceleracja 3D dotyczyła jedynie etapu samej rasteryzacji, tj. poprzedzające ją elementy potoku graficznego przetwarzania 3D były realizowane przez procesor komputera. W roku 1999 został opracowany pierwszy układ NVIDIA GeForce 256 realizujący funkcje akceleracji T&L (ang. Transform and Lighting — transformacji i oświetlenia). Następne generacje układów zostały rozszerzone o możliwości programowania operacji cieniowania wierzchołków i pikseli [76].

Na dzień dzisiejszy procesory graficzne GPU (ang. Graphics Processing Unit — procesor graficzny) osiągnęły na tyle wysoki stopień programowalności oraz możliwości obliczeniowych, że mogą być wykorzystywane także do realizacji obliczeń niekoniecznie związanych z przetwarzaniem grafiki [45, 120]. Programowalność oraz bardzo wysoka wydajność GPU, wielokrotnie większa od wydajności procesorów PC, spowodowała powstanie nowego kierunku w zastosowaniach procesorów graficznych, a mianowicie GPGPU (ang. General Purpose Computing on GPU — obliczenia ogólnego przeznaczenia na GPU) [1, 3]

W dalszej części zostaną przedstawione zagadnienia związane z GPU: przetwarzanie grafiki 3D, architektura wewnętrzna oraz realizacja algorytmów obliczeniowych.

## 3.1.4.1 Potok przetwarzania 3D

Interfejs programistyczny oraz potok (algorytm) przetwarzania grafiki 3D został określony przez standard OpenGL [23] stworzony przez firmę Silicon Graphics. Innym popularnym interfejsem programistycznym dla grafiki 3D jest Direct3D (element DirectX) opracowany wyłącznie dla platformy Microsoft Windows [56]. Oba interfejsy są oparte na podobnym potoku

graficznym natomiast różnią się istotnie pod względem interfejsu dostępnego dla programisty. Zastosowanie GPU wraz z odpowiednimi sterownikami do OpenGL lub DirectX powoduje przeniesienie ciężaru realizacji potoku graficznego z procesora głównego na procesor graficzny. Na rys. 3.5 przedstawiono potok przetwarzania grafiki 3D. Danymi wejściowymi do potoku są modele w przestrzeni 3D, a wyjściem obraz na ekranie monitora [83]. Zbiór wierzchołków/krawędzi z dołączonymi do nich parametrami (np. kolor, współrzędne tekstury, normalna) opisują obiekty w przestrzeni 3D, czyli modele. Opis tworzonej sceny jest uzupełniony o informacje globalne dotyczące oświetlenia (typ, źródła i kierunki światła). Przetwarzanie odbywa się w dwóch etapach: geometrii i rasteryzacji. Etap geometrii dotyczy operacji na wierzchołkach modeli w przestrzeni 3D oraz po rzutowaniu w przestrzeni 2D. Etap rasteryzacji odbywa się na fragmentach (najczęściej trójkątach) powstałych po rzutowaniu obiektów 3D na płaszczyznę ekranu i przycięciu ich do widocznego obszaru.



Rysunek 3.5: Potok przetwarzania 3D (na podstawie [76])

Opis poszczególnych kroków przetwarzania etapów geometrii i rasteryzacji [76]:

- **Transformacja Model-Widok (ang. Model-View transform).** Modele, z których powstają obiekty, są określone najczęściej w swoich własnych układach odniesienia zwanych przestrzenią modelu. Obiekty powstają z modelu po transformacji jego współrzędnych (np. skalowanie, obrót, przesunięcie). Tak przetransformowane modele są umieszczone już we wspólnej przestrzeni świata. Transformacja widoku przekształca przestrzeń świata do przestrzeni oka/kamery, która jest związana z położeniem i kierunkiem oka obserwatora (kamery). Wszystkie powyższe transformacje dotyczą nie tylko współrzęd-nych wierzchołków, ale także normalnych, które mogą być określone dla wierzchołków do celów obliczania oświetlenia. Każda z powyższych transformacji jest zdefiniowana za pomocą osobnej macierzy 4x4, które najczęściej łączy się w jedną macierz, ze względów wydajnościowych.
- **Oświetlenie (ang. lighting)** polega na obliczaniu wartości koloru w wierzchołkach na podstawie informacji o kolorze, normalnej oraz typie i kierunku źródeł światła. Istnieje kilka różnych uproszczonych modeli obliczania oświetlenia różniących się stopniem skomplikowania i jakością uzyskiwanych rezultatów (np.: Phong, Gouraud).

Rzutowanie (ang. projection). Przetransformowane i oświetlone obiekty są rzutowane na jed-

nostkową kostkę określającą widoczną objętość. W zależności od zastosowania stosuje się rzutowanie ortograficzne (równoległe) lub perspektywiczne.

- **Obcinanie (ang. clipping).** Na tym etapie wierzchołki na podstawie informacji o ich połączeniach są składane w obiekty (odcinki, trójkąty, wielokąty). Tylko obiekty, które są w całości lub we fragmencie zawarte w widocznej objętości są przekazywane do rasteryzacji. Obiekty częściowo zawarte w widocznej objętości wymagają przycięcia wierzchołków. Wierzchołki wystające poza widoczną objętość są zastępowane nowymi znajdującymi się na przecięciu obiektu z płaszczyznami ograniczającymi widok.
- **Mapowanie na ekran (ang. screen mapping).** Współrzędne 3D przyciętych obiektów znajdujące się w widocznej objętości są przekształcane do współrzędnych ekranowych. Współrzędna głębokości jest zapamiętywana w tzw. Z-buforze, który będzie wykorzystywany do określenia zasłaniania obiektów na etapie rasteryzacji.
- **Rasteryzacja (ang. rasterization)** polega na wypełnieniu poszczególnych fragmentów kolorem. Kolor jest określany na podstawie danych przekazanych z etapu geometrii: kolorów w wierzchołkach i współrzędnych tekstur. Określanie koloru pikseli nazywane jest cieniowaniem.
- **Zasłanianie (ang. culling)** służy do określania widoczności fragmentów na ekranie. Bufor głębokości (Z-bufor), wypełniany na etapie rzutowania, zawiera informację o odległości najbliższego punktu (w przestrzeni 3D) od kamery. W trakcie wypełniania fragmentów kolorem porównywana jest głębokość punktu z wartością w Z-buforze; punkty znajdujące się głębiej niż wartość w buforze nie są rysowane.
- **Cieniowanie (ang. shading).** Kolor każdego piksela wypełniającego widoczne fragmenty obrazu jest określany na podstawie zastosowanego modelu oświetlenia oraz dodatkowych atrybutów (np. normalnej do powierzchni, tekstury, etc.). Składową koloru może być także przezroczystość, dzięki czemu na kolor pojedynczego piksela ekranu mogą mieć wpływ fragmenty znajdujące się na różnych głębokościach.
- Nakładanie tekstur (ang. texturing). Tekstury to obrazy (najczęściej 2D) mające nadać powierzchniom bardziej rzeczywisty wygląd bez konieczności komplikacji samego modelu. Znormalizowane współrzędne tekstury są określane dla wierzchołków modelu 3D. Płaskie obrazy muszą zostać odpowiednio przekształcone nieliniowo w procesie nakładania na niepłaskie powierzchnie modelu. Dodatkowo, w celu uniknięcia artefaktów, w procesie próbkowania punktów tekstury stosowana jest interpolacja.
- **Operacje na pikselach.** Na końcowy kolor pikseli składa się kolor wypełnionego fragmentu (lub wielu fragmentów, jeśli fragmenty posiadają przezroczystość) oraz kolor jednej lub wielu nałożonych tekstur. Ten proces mieszania/nakładania kolorów nazywany jest z ang. blending.

W programowalnych układach GPU mogą być wykonywane programy cieniujące (ang. pixel shaders), które modyfikują lub zastępują opisane powyżej etapy cieniowania, nakładania tekstur oraz operacji na pikselach.

## 3.1.4.2 Architektura GPU

Współczesne układy graficzne są specjalizowanymi procesorami obliczeniowymi. Architektura GPU jest zoptymalizowana do przetwarzania strumieniowego potoku graficznego 3D. Implementacja potoku przetwarzania 3D i jego podział pomiędzy procesor główny oraz procesor GPU została przedstawiona na rys. 3.6 [46]. Potok ten został rozszerzony o programowalne procesory wierzchołków i fragmentów w stosunku do potoku 3D opisanego w poprzednim punkcie (rys. 3.5). Procesory te mogą wykonywać ładowalne programy (shadery), co pozwala na rozszerzanie funkcjonalności nieprogramowalnego potoku graficznego.



Rysunek 3.6: Implementacja GPU potoku przetwarzania 3D (na podstawie [46])

Programowalne układy GPU zawierają wiele jednostek wykonawczych operujących na wektorach (współrzędne wierzchołków, kolory pikseli, etc.) oraz na fragmentach (kolory pikseli, tekstury). Układ może realizować standardowy potok przetwarzania 3D lub potok w pełni programowalny za pomocą jednostek wierzchołków (ang. vertex shader) oraz fragmentów (ang. pixel shader). Jednostki wierzchołków odpowiadają za realizację przekształceń geometrycznych na wierzchołkach w przestrzeni 3D (etapy transformacji Model-Widok oraz oświetlenia standardowego potoku graficznego). Jednostki fragmentów operuja na fragmentach po etapie rasteryzacji i moga realizować funkcje mieszania kolorów oraz nakładania tekstur. Oba typy jednostek obliczeniowych posiadają własny zestaw instrukcji oraz obsługują określone typy danych. W najnowszych układach (np. GeForce 8800) jednostki obliczeniowe zostały zunifikowane (tj. nie ma wydzielonych jednostek wierzchołków i fragmentów), co umożliwia ich dynamiczny przydział do zadań w zależności od potrzeb [107]. Jednostki wykonawcze GPU są typu SIMD, czyli jeden strumień instrukcji jest wykonywany niezależnie na wielu strumieniach danych wejściowych, co zapewnia równoległe przetwarzanie wielu strumieni danych. Liczba i możliwości jednostek zależa od modelu układu i stopnia jego programowalności. Karty graficzne są wyposażone w dedykowaną pamieć o pojemności 128–1024 MB, która jest pamięcią operacyjną dla GPU oraz buforem ramki (ang. framebuffer). Architektura i wydajność pamieci graficznych jest także zoptymalizowana do strumieniowego przetwarzania grafiki. Programy wierzchołków i fragmentów mają bardzo ograniczone możliwości dostępu do danych; mogą działać jedynie na przekazanych danych wejściowych i nie mogą realizować arbitralnych dostępów do pamięci [106].

Na rys. 3.7 przedstawiono architekturę współczesnego procesora graficznego z rodziny NVIDIA GeForce 8800 [107]. Układ ten (model 8800GTX) zawiera 128 zunifikowanych skalarnych jednostek obliczeniowych pracujących z zegarem 1,35 GHz oraz wyposażony jest w 384bitowy interfejs do pamięci zewnętrznej. Jednostki obliczeniowe są pogrupowane w 8 klastrów każdy składający się z 16 multiprocesorów. Każdy multiprocesor zawiera 16 zunifikowanych jednostek obliczeniowych oraz zestaw rejestrów, 16 kB pamięci lokalnej i 64 kB pamięci podręcznej (L1). Dodatkowo każdy klaster posiada jedną jednostkę teksturującą realizującą funkcje adresowania i filtracji tekstur. Zunifikowane procesory skalarne są oparte na uniwersalnej liście instrukcji i realizują operacje arytmetyczne na 32-bitowych liczbach stało i zmiennopozycyjnych.



Rysunek 3.7: Architektura procesora graficznego NVIDIA GeForce 8800: M1–8 — multiprocesor, P — jednostka skalarna, T — jednostka teksturowania, L1 — pamięć podręczna pierwszego poziomu, L2 — pamięć podręczna drugiego poziomu, FB — interfejs do pamięci, ROP — jednostka operacji rastrowych (na podstawie [107])

## 3.1.4.3 Wydajność GPU

Wydajność obliczeniowa współczesnych procesorów GPU wielokrotnie przekracza wydajność najszybszych procesorów komputerów PC (rys. 3.8). Obserwowana wydajność najnowszego procesora graficznego NVIDIA GeForce 8800GTX dla operacji zmiennopozycyjnych przekracza 300 GFLOPS, natomiast przepustowość pamięci osiąga 80 GB/s [109].

Ogromna wydajność jest związana z masową równoległością (dużą liczbą jednostek wykonawczych) oraz dostępną przepustowością pamięci graficznej. Masowa równoległość przetwarzania możliwa jest dzięki strumieniowej architekturze przetwarzania (potok graficzny) oraz brakiem zależności pomiędzy danymi. Taka architektura umożliwia zrównoleglenie wykony-



Rysunek 3.8: Porównanie wydajności procesorów GPU i CPU [3]

wanych obliczeń, ale jednocześnie wprowadza ograniczenia na dostęp do danych. Dlatego realizacja "nie graficznych" algorytmów obliczeniowych na GPU nie jest łatwym zagadnieniem.

# 3.1.4.4 Języki programowania GPU

Jednostki wykonawcze układów GPU (tzw. shadery) są specjalizowanymi procesorami z określoną listą instrukcji i mogą być programowane w języku asemblera. Powstały także języki wysokiego poziomu mające ułatwić programowanie i uniezależnić programistów od szybko zmieniającej się architektury i możliwości układów. Zestaw instrukcji jednostek zależy od modelu układu i stopnia jego programowalności. Obecny trend rozwojowy układów GPU idzie w kierunku unifikacji jednostek wykonawczych.

Wśród języków programowania wysokiego poziomu shaderów można wyróżnić języki "graficzne" (klasyczne) oraz nowe języki aplikacyjne. Języki "graficzne" powstały do programowania shaderów w zastosowaniach graficznych i wymagają stosowania bibliotek graficznych do ich uruchamiania. Przykładem są języki: Cg (NVIDIA), HLSL (Microsoft) związane z biblioteką DirectX oraz OpenGL Shading Language (3Dlabs) wymagający biblioteki OpenGL. Zastosowanie języków wysokiego poziomu z dynamiczną generacją kodu dla procesora GPU pozwala na automatyczną rekompilację raz napisanego kodu dla różnych architektur i nowych generacji procesorów graficznych. Nowe języki aplikacyjne: Accelerator (Microsoft) [137], Brook (Stanford University) [31], CUDA (NVIDIA) [108] nie wymagają już stosowania bibliotek graficznych i są zorientowane na wykorzystanie GPU jako uniwersalnych procesorów obliczeniowych. Nowe języki aplikacyjne ułatwiają przenoszenie i wektoryzację algorytmów obliczeniowych, tak aby w pełni wykorzystać architekturę GPU.

# 3.2 Układy przetwarzania analogowo-cyfrowego

Przetworniki analogowo-cyfrowe (A/C) i cyfrowo-analogowe (C/A) stanowią interfejs pomiędzy światem analogowym a cyfrowymi systemami przetwarzania sygnałów. Parametry przetworników determinują dokładność wejściową i/lub wyjściową systemów DSP oraz mają wpływ na parametry dynamiczne całego systemu. W dalszej części przedstawiono zagadnienia związane z budową, specyfikacją oraz pomiarami przetworników A/C, które to zagadnienia są istotne dla pracy i projektu elektronicznego.

# 3.2.1 Zasada działania przetworników A/C

Przetwarzanie analogowo-cyfrowe składa się z dwóch procesów: próbkowania i dyskretyzacji. Próbkowanie to proces określania wartości sygnału analogowego w dyskretnych chwilach czasu. Spróbkowany sygnał analogowy jest następnie poddawany dyskretyzacji, czyli przypisaniu wartości cyfrowej. Liczba dyskretnych poziomów wyjściowych przetwornika A/C jest określona przez jego liczbę bitów (rozdzielczości). Funkcję konwersji idealnego przetwornika A/C przedstawia krzywa schodkowa widoczna na rys. 3.9.



Rysunek 3.9: Funkcja konwersji idealnego 3-bitowego przetwornika A/C (kodowanie binarne unipolarne)

W rzeczywistych przetwornikach występują różne źródła błędów powodujące zniekształcenia tej charakterystyki. Charakterystyka przetwarzania A/C zależy od bardzo wielu czynników zarówno wewnętrznych, jak i zewnętrznych m.in.:

- parametrów samego przetwornika (które z kolei zależą od jego budowy wewnętrznej, parametrów struktury półprzewodnikowej, temperatury zewnętrznej, etc.),
- parametrów zewnętrznych analogowych układów kondycjonujących sygnał do przetwornika,
- parametrów zewnętrznych układów zasilania przetwornika,
- parametrów zewnętrznych układów zegarowych taktujących przetwornik,
- charakterystyki sygnału wejściowego (pasma, amplitudy, etc.).

Wszelkie zniekształcenia charakterystyki przetwarzania można opisywać za pomocą modeli/źródeł szumu (rys. 3.10). Opis szumowy, popularny w zastosowaniach elektronicznych oraz telekomunikacyjnych, oparty jest na modelach probabilistycznych. W telekomunikacji decydującym parametrem jakości kanału transmisyjnego jest stosunek sygnał-szum, który determinuje jakość detekcji i jest bezpośrednio związany ze stopą błędów transmisji. Podobnie w ultrasonografii obrazowanie jest oparte na detekcji sygnału nadawczego w odebranych echach i tutaj także stosunek sygnał-szum ma znaczenie podstawowe.



Rysunek 3.10: Źródła zniekształceń i szumu w układzie przetwornika A/C (na podstawie [68])

# 3.2.2 Architektura przetworników A/C

Obecnie na rynku występuje ogromna mnogość przetworników A/C zoptymalizowanych do różnorodnych zastosowań w zakresie rozdzielczości 1–24 bitów oraz prędkości próbkowania od pojedynczych herców do dziesiątków GHz. W zależności od zastosowania (rozdzielczości i prędkości) można wyróżnić kilka podstawowych architektur przetworników [68]:

- **SAR (ang. Successive Approximation Register rejestr sukcesywnej aproksymacji)** jest jedną z pierwszych i najbardziej popularnych architektur stosowanych w zakresie prędkości do kilku MSPS (ang. Mega Samples Per Second - milionów próbek na sekundę) i rozdzielczościach do 18 bitów. Bity rejestru są w kolejnych krokach ustawiane (zaczynając od najstarszego), a wartość rejestru konwertowana na postać analogową przez przetwornik C/A i porównywana z wartością napięcia wejściowego. Jeśli wartość analogowa przekracza wartość wejściową bit jest zerowany, inaczej pozostaje ustawiony. W ten sposób w *n* krokach (gdzie *n* jest liczbą bitów przetwornika) generowane jest cyfrowe słowo wyjściowe.
- Sigma-Delta składa się z układu modulatora, w którym analogowy sygnał wejściowy jest kwantyzowany przez jednobitowy przetwornik A/C (komparator). Wyjściowy sygnał binarny jest z powrotem zamieniany na sygnał analogowy i po przejściu przez integrator odejmowany od sygnału wejściowego. Jednobitowy strumień z modulatora jest cyfrowo filtrowany i decymowany w celu otrzymania wielobitowego słowa wyjściowego. Częstotliwość pracy modulatora (próbkowania) jest wielokrotnie wyższa od prędkości przetwarzania całego przetwornika. Zastosowanie nadpróbkowania i kształtowania widma szumu przez filtrację cyfrową pozwala na uzyskanie wysokiej rozdzielczości wyjściowej ze strumienia jednobitowego [28, 115]. Taka możliwość wynika z faktu, że szum kwantyzacji rozkłada się równomiernie w całym paśmie dzięki czemu jego poziom w wyfiltrowanej wąskiej części pasma może zostać obniżony. Przetworniki Sigma-Delta charakteryzują się dużą rozdzielczością (16–24 bitów) oraz prędkością do pojedynczych MSPS. Główny obszar zastosowań tych konwerterów to aplikacje audio oraz systemy pomiarowe sygnałów wolnozmiennych.

- **Flash** przetworniki równoległe są zbudowane w oparciu o zestaw  $2^{n-1}$  komparatorów (gdzie *n* jest liczbą bitów przetwornika), które dokonują jednoczesnego porównania napięcia wejściowego z ułamkowymi częściami napięcia odniesienia, wygenerowanymi za pomocą dzielników. Największą zaletą tej architektury jest jej szybkość działania (do kilku GSPS). Ze względu na bardzo dużą liczbę wymaganych komparatorów, a co za tym idzie wysoki pobór prądu, przetworniki w tej architekturze nie przekraczają rozdzielczości 8 bitów.
- **Pipelined** przetworniki potokowe (lub szeregowo-równoległe) składają się z kilku stopni porównania. Każdy stopień porównania wytwarza kilka bitów wyniku i składa się z przetwornika równoległego (Flash), przetwornika C/A oraz analogowych układów różnicowych (rys. 3.11). Każdy kolejny stopień jest oddzielony od poprzedniego układem śledząco-pamiętającym (ang. T/H — Track & Hold). Pierwszy stopień wytwarza najstarsze bity wyniku i odejmuje zmierzoną wartość sygnału analogowego od napięcia wejściowego. Kolejne stopnie dyskretyzują otrzymaną "resztkową" wartość sygnału. Dzięki potokowej architekturze częstotliwość pracy przetwornika jest równa czasowi przejścia przez pojedynczy blok. Ponieważ jednak wytworzenie wyniku wymaga przejścia sygnału przez wszystkie kolejne bloki występuje opóźnienie potokowe (zwane także latencją). Obecnie dostępne są przetworniki potokowe w zakresie rozdzielczości 10–16 bitów i prędkości do 500 MSPS. Duża prędkość działania przy stosunkowo wysokiej rozdzielczości powoduje, że ten typ przetworników jest szeroko stosowany w telekomunikacji oraz ultrasonografii.



Rysunek 3.11: Budowa przetwornika potokowego na przykładzie 14-bitowego przetwornika A/C firmy Texas Instruments ADS5474 [139]: A1–3 — wzmacniacze, TH1–3 — układy śledząco-próbkujące, ADC1– 3 — przetworniki A/C, DAC1–2 — przetworniki C/A

W technice ultradźwiękowej (ultrasonografia, doppler, badania nieniszczące) do digitalizacji sygnału w.cz. najczęściej stosowane są przetworniki potokowe o rozdzielczościach 8–14 bitów i prędkościach 40–70 MSPS. Do zastosowań w ultrasonografach z cyfrowym beamformingiem są dostępne specjalizowane przetworniki wielokanałowe (2–8 kanałów w jednym układzie) pozwalające na znaczącą redukcję rozmiarów urządzeń [20].

# 3.2.3 Specyfikacja przetworników A/C

Układy przetworników A/C są specyfikowane przy pomocy wielu parametrów określających ich własności pomiarowe. Parametry te możemy podzielić na parametry statyczne oraz dynamiczne, w zależności od typu sygnału użytego do ich pomiaru. Do parametrów statycznych należy rozdzielczość (określająca liczbę bitów przetwornika) oraz błędy wzmocnienia, zera, nieliniowości, etc. — określające różne typy zniekształceń charakterystyki w stosunku do przetwornika idealnego. Niestety opis za pomocą parametrów statycznych nie jest wystarczający dla sygnałów zmiennych w czasie z jakimi mamy najczęściej do czynienia w przetwarzaniu cyfrowo-analogowym. Pomiar parametrów dynamicznych przetwornika przy użyciu sygnałów zmiennych jest znacząco trudniejszy gdyż zależy także od charakterystyki sygnału wejściowego. W przypadku niektórych zastosowań konieczna jest charakteryzacja przetwornika przy pomocy określonego typu sygnałów wejściowych specyficznych dla tego zastosowania. Producenci układów A/C ustalili pewien zestaw parametrów dynamicznych i warunków ich pomiarów, który jest specyfikowany dla danego typu przetworników (choć występują pewne różnice pomiędzy producentami). Dla wielu zastosowań ten kanon parametrów określanych w specyfikacji przetwornika jest wystarczający. W dalszej części przedstawiono przegląd parametrów statycznych i dynamicznych przetworników A/C oraz zagadnienia związane z ich pomiarami.

## 3.2.3.1 Parametry statyczne

Parametry statyczne przetworników A/C są określane i mierzone dla statycznych pobudzeń wejściowych. Najważniejsze parametry statyczne zostały krótko przedstawione (rys. 3.12) i opisane poniżej [18]:

- **Dokładność** określa maksymalny całkowity błąd pomiarowy przetwornika przy określonym napięciu sygnału wejściowego. Błąd ten zawiera wszystkie możliwe źródła błędów statycznych: błąd kwantyzacji, zera, wzmocnienia, nieliniowości. Technicznie dokładność pomiarowa przetwornika może być kalibrowana wg. standardów przemysłowych (np. National Institute of Standards and Technology) ale nie jest to praktykowane dla układów scalonych.
- **Rozdzielczość** jest bezpośrednio związana z liczbą bitów przetwornika A/C i oznacza wartość najmniej znaczącego bitu (LSB ang. Least Significant Bit). Liczba bitów przetwornika/rozdzielczość determinuje także nominalny zakres dynamiki, szerokość kodu (wartość napięcia) oraz błąd kwantyzacji.
- **Zakres dynamiki** jest stosunkiem maksymalnej wartości wyjściowej do minimalnej wartości wyjściowej i może być określony dla danej liczby bitów przetwornika N jako:  $20 \log_{10}(2^N)$ .
- **Błąd zera (offsetu)** jest odchyłką wartości napięcia wejściowego od idealnej wartości 0,5 LSB dla której powinno nastąpić pierwsze przejście kodu wyjściowego (rys. 3.12a).
- **Błąd wzmocnienia** jest odchyłką nachylenia funkcji konwersji przetwornika od idealnej linii łączącej punkty zero i pełnej skali (rys. 3.12b).
- **Błąd nieliniowości różnicowej** jest odchyłką szerokości kodu od idealnej wartości 1 LSB (rys. 3.12c). W specyfikacjach można najczęściej spotkać się z maksymalną wartością tej odchyłki.
- **Błąd nieliniowości całkowej** jest odległością pomiędzy przejściem kodu funkcji konwersji przetwornika od punktu przejścia kodu dla funkcji idealnej (rys. 3.12d).
- **Brakujący kod** oznacza wyjściowy kod cyfrowy, który nie występuje dla żadnej wartości napięcia wejściowego (rys. 3.12e). Brakujące kody mogą być spowodowane dużym błędem nieliniowości różnicowej lub niemonotonicznością funkcji konwersji przetwornika.
**Błąd/szum kwantyzacji** spowodowany jest skończoną rozdzielczością przetwornika A/C, która ogranicza stosunek sygnał-szum. Szum kwantyzacji jest immanentną cechą przetworników A/C, która występuje także dla przetwornika idealnego (!). W większości przypadków bezpieczne jest założenie, że jest to szum nieskorelowany i jednorodny, co pozwala obliczyć stosunek sygnał-szum jako:  $SNR = 6,02 \cdot N + 1,76$  [dB]

### 3.2.3.2 Parametry dynamiczne

Parametry dynamiczne są określane dla przetwornika przy pobudzeniu sygnałem zmiennym w czasie o określonej charakterystyce. Wewnętrzne i zewnętrzne źródła szumów degradują stosunek sygnał-szum idealnego przetwornika, w którym występuje jedynie szum kwantyzacji. Poniżej przedstawiono najważniejsze z parametrów dynamicznych specyfikowanych przez producentów układów w kartach katalogowych.

- SINAD (ang. Signal to Noise and Distortion Ratio Stosunek sygnał-szum + zakłócenia) jest to stosunek wyrażony w decybelach wejściowej wartości RMS (ang. Root Mean Square — wartość skuteczna) sygnału do wartości RMS szumu przetwornika w paśmie od 0 Hz do częstotliwości Nyquista. Parametr ten jest określany dla pobudzeń sygnałem sinusoidalnym o wybranej częstotliwości, a obliczenia realizowane są na widmie FFT sygnału cyfrowego z przetwornika (rys. 3.13). SINAD zależy od częstotliwości i amplitudy sygnału wejściowego dlatego często jest wykreślany w funkcji tych parametrów.
- **ENOB** (ang. Effective Number of Bits Efektywna liczba bitów) określa efektywną liczbę bitów idealnego przetwornika A/C odpowiadającego dynamice danego przetwornika SI-NAD wyrażonej w decybelach — zgodnie z zależnością:  $ENOB = \frac{(SINAD-1,76)}{6,02}$ . Efektywna liczba bitów nie jest najczęściej liczbą całkowitą, ale daje dobre pojęcie o jakości przetwornika w stosunku do jego deklarowanej rozdzielczości.
- **SFDR (ang. Spurious-Free Dynamic Range zakres dynamiki bez zakłóceń)** jest to stosunek wyrażony w decybelach wejściowej wartości sygnału do wartości największego zakłócenia w widmie FFT (rys. 3.13). Najczęściej tym maksymalnym zakłóceniem jest harmoniczna sygnału wejściowego pojawiająca się w widmie przetwornika spowodowana nieliniowością. SFDR zależy od częstotliwości i amplitudy sygnału wejściowego.
- **THD** (ang. Total Harmonic Distortion całkowite zniekształcenia harmoniczne) jest stosunkiem wyrażonym w decybelach wejściowej wartości RMS sygnału do sumy RMS pierwszych pięciu harmonicznych sygnału. Należy zauważyć, że wyższe harmoniczne, których częstotliwości wykraczają poza częstotliwości Nyquista, ulegają nałożeniu (aliasingowi) na dolną część pasma.
- **IMD** (ang. Intermodulation distortion zniekształcenia intermodulacyjne) są określone dla sygnału wejściowego w postaci dwóch sygnałów sinusoidalnych o częstotliwościach f1, f2 i obliczane jako stosunek mocy sygnału wejściowego do mocy produktów intermodulacyjnych będących sygnałami o częstotliwościach równych sumie i różnicy sygnałów wejściowych.
- **Opóźnienie apertury (ang. Aperture Delay)** oznacza opóźnienie pomiędzy sygnałem rozpoczęcia konwersji (zboczem zegara próbkującego) a momentem rzeczywistego próbkowania wartości analogowej na wejściu (rys. 3.14).



Rysunek 3.12: Zniekształcenia i błędy przetworników A/C (na podstawie [18])



Rysunek 3.13: Definicja parametrów dynamicznych na przykładowym widmie FFT (8192 punktów) dla częstotliwości wejściowej  $f_{in}$  = 10 kHz: A — sygnał podstawowy, B — pierwsza harmoniczna, C — druga harmoniczna, D — SFDR, E — SINAD, F — średni poziom szumów (na podstawie [18])

**Jitter apertury (ang. Aperture Jitter)** jest zmiennością (rozrzutem) wartości opóźnienia apertury występującym w czasie pomiędzy kolejnymi konwersjami. Jitter apertury jest zjawiskiem losowym i powoduje powstanie dodatkowego szumu na wyjściu przetwornika związanego z błędami próbkowanego napięcia (rys. 3.14). Jitter jest specyfikowany w postaci funkcji gęstości prawdopodobieństwa lub w postaci statystyk np. RMS. Należy podkreślić, że na całkowity jitter apertury systemu przetwarzania A/C składa się jitter apertury samego przetwornika oraz jitter zewnętrznego zegara próbkującego.



Rysunek 3.14: Definicja jittera apertury próbkowania przetwornika A/C (na podstawie [68])

### 3.2.3.3 Jitter w układach przetwarzania A/C

Zagadnienie jittera w układach przetwarzania A/C wysokich częstotliwości jest bardzo istotne, gdyż często determinuje możliwy do uzyskania stosunek sygnał-szum [133, 27]. Jitter apertury

jest odchyłką czasową od idealnej pozycji zbocza sygnału próbkującego i składa się na niego jitter przetwornika (jego układu próbkująco-pamiętającego) oraz jitter sygnału zegarowego synchronizującego przetwornik (rys. 3.14). Jitter jest procesem losowym dlatego jego pomiary wymagają metod statystycznych [5]. Całkowity jitter TJ (ang. Total Jitter) składa się z jittera przypadkowego RJ (ang. Random Jitter) oraz jittera deterministycznego DJ (ang. Deterministic Jitter). Jitter losowy to różnego rodzaju zaburzenia losowe (przede wszystkim procesy termiczne), które łącznie składają się na jego gaussowski kształt rozkładu prawdopodobieństwa. Część deterministyczna to efekt zaburzeń systematycznych np. różne czasy narastania i opadania zboczy zegarowych, synchroniczne zakłócenia z innych źródeł (np. zasilania), itp..

Jitter apertury jest powodem powstawania szumu próbkowania przez co ogranicza stosunek sygnał-szum przetwornika. Dla wejściowego sygnału sinusoidalnego o amplitudzie *A* i częstości  $\omega$  maksymalne nachylenie występuje przy przejściu przez zero i wynosi  $\omega A$ . Wyjściowe napięcie szumu przy jitterze apertury równym  $t_a$  wynosi [26]:

$$V_{\rm rms} = t_a \omega A = t_a 2\pi f A$$

natomiast stosunek sygnal-szum:

$$SNR_{\text{jitter}} = 20\log_{10}\left(\frac{A}{V_{\text{rms}}}\right) = 20\log_{10}\left(\frac{1}{2\pi f t_a}\right).$$

Korzystając z powyższej zależności na rys. 3.15 przedstawiono wykres możliwej do uzyskania efektywnej liczby bitów przetwarzania A/C w zależności wielkości jittera apertury oraz częstotliwości wejściowego sygnału w.cz.. Parametry jittera przetworników A/C są najczęściej wystarczająco dobre, więc o jitterze całego układu decyduje jakość zegara. Na rys. 3.15 pokazano także zakresy jittera uzyskiwane przez poszczególne typy oscylatorów:

- VCO (ang. Voltage Controlled Oscillator oscylator kontrolowany napięciem) z pętlą fazową PLL,
- VCXO (ang. Voltage Controlled Crystal Oscillator oscylator kwarcowy kontrolowany napięciem),
- oscylator niskoszumny.

Specjalizowane wąskopasmowe układy pętli fazowych (PLL) są także stosowane jako dodatkowe filtry jittera [54].

W ostatnich latach na rynku pojawiły się specjalizowane układy do generacji i dystrybucji zegara o odpowiednio wysokich parametrach (np. Analog Devices AD9510). Oprócz jakości zegara także sposób jego doprowadzenia do przetwornika A/C ma istotne znaczenie. Obecnie coraz częściej stosuje się dystrybucję zegara za pomocą różnicowych interfejsów cyfrowych (np. LVDS, LVPECL), które zapewniają największą odporność na zakłócenia zewnętrzne. Układy cyfrowe dużej skali integracji (szczególnie FPGA) są źródłem dużego jittera dlatego nie mogą być stosowane do dystrybucji zegara [26, 127].

### 3.2.4 Pomiary układów przetworników

Duża liczba parametrów przetworników wymaga wielu różnych metod i algorytmów pomiarowych. Parametry statyczne są stosunkowo najłatwiejsze do określenia gdyż wymagają doprowadzenia stałego precyzyjnego napięcia na wejście przetwornika i wykonania pewnej liczby pomiarów. Zmieniając napięcie wejściowe można zdjąć całą charakterystykę przetwarzania przetwornika. Za pomocą metod statystycznych (np. histogram) można określić rozrzut



Rysunek 3.15: Zależność efektywnej liczby bitów przetwornika A/C od jittera apertury oraz częstotliwości próbkowanego sygnału (na podstawie [68])

wartości pomiarowych. Dla parametrów dynamicznych istnieje kilka różnych metod pomiarowych (np. metoda FFT, metoda histogramu, metoda dopasowania krzywej), przy czym niektóre z nich służą do określania tylko jednego parametru. Najpopularniejszą metodą, ze względu na jej uniwersalność, jest metoda pomiarowa przy pomocy transformaty Fouriera (zwana także metodą FFT), która zostanie krótko przedstawiona [29].

### 3.2.4.1 Pomiar parametrów dynamicznych metodą FFT

W metodzie FFT parametry dynamiczne (SNR, SINAD, SFDR, THD, ENOB, IMD) są określane z widma FFT sygnału na wyjściu przetwornika pobudzonego sygnałem sinusoidalnym [77]. Na wejście przetwornika jest doprowadzany sygnał sinusoidalny z generatora o dobrze określonej częstotliwości i amplitudzie. Generator musi charakteryzować się jakością sygnału znacząco wyższą od parametrów mierzonego przetwornika. Często ze względu na zbyt wysokie zniekształcenia harmoniczne na wyjściu generatorów stosuje się wąskopasmowe filtry pasywne [80]. Cyfrowe dane z wyjścia przetwornika A/C są z częstotliwością próbkowania zapisywane w buforze pamięci. Rekord danych o długości standardowo 4096–16384 jest poddawany transformacie FFT i prezentowany jako widmo mocy sygnału [78]. Na rys. 3.16 przedstawiono schematycznie wykres widma 4096 punktowej FFT i zależności poziomu szumów dla idealnego 12-bitowego przetwornika. Długość okna FFT wpływa na rozdzielczość częstotliwościową oraz na poziom szumu FFT. Poziom szumu kwantyzacji zależy od liczby bitów przetwornika (nie zależy od długości okna). Definicję parametrów dynamicznych na widmie FFT przedstawiono na rys. 3.13.

Metoda FFT ma pewne niedoskonałości związane z własnościami dyskretnej transformaty Fouriera, które występują dla szczególnych stosunków częstotliwości wejściowej, częstotliwości próbkowania oraz długości okna. W celu uniknięcia błędów zaleca się stosowanie tzw.



Rysunek 3.16: Dynamika widma 4096 punktowego FFT dla idealnego 12-bitowego przetwornika A/C (na podstawie [68])

próbkowania koherentnego [79] dla którego:

$$f_{\rm wej.} / f_{\rm próbk.} = N_{\rm cykli} / N_{\rm FFT}$$

gdzie:  $f_{wej.}$  — częstotliwość sygnału wejściowego,  $f_{próbk.}$  — częstotliwość próbkowania przetwornika,  $N_{cykli}$  — całkowita liczba cykli w oknie próbkowania,  $N_{FFT}$  — liczba próbek okna próbkowania.

W przypadku niemożliwości spełnienia powyższego warunku występuje efekt rozmycia widma (ang. spectral leakage) objawiający się poszerzeniem prążka widma częstotliwości wejściowej. Należy wtedy stosować znane z literatury funkcje okna (np. Hamminga), które zmniejszają ten niepożądany efekt [74, 157].

# 3.3 Budowa ultrasonografu

Ultrasonografy są bardzo złożonymi systemami elektronicznymi wykorzystującymi najnowsze osiągnięcia mikroelektroniki i cyfrowego przetwarzania sygnałów. W tym rozdziale przedstawiono schemat blokowy aparatu i przetwarzania sygnału w klasycznej (nie kodowanej) ultrasonografii. Ponieważ dalsza praca dotyczy realizacji jednokanałowego systemu obrazującego z głowicą jednoelementową i mechanicznym skanowaniem wiązki, zagadnienia beamformingu, głowic wieloelementowych oraz trybu dopplera nie będą omawiane. Niezbędne modyfikacje klasycznego toru przetwarzania dla potrzeb transmisji kodowanej zostaną opisane w podrozdziale 4.1.

### 3.3.1 Tor przetwarzania sygnału w ultrasonografii obrazowej

Schemat blokowy ultrasonografu przedstawiono na rysunkach 3.17, 3.18. Układ nadajnika generuje krótkie impulsy wysokiego napięcia, które pobudzają przetwornik głowicy ultradźwiękowej. Sygnały elektryczne ech z przetwornika po przejściu przez układ przełącznika Nadawanie/Odbiór trafiaja do układu wzmacniaczy. Układ przełacznika ma na celu zabezpieczenie bardzo czułych stopni wejściowych przed impulsami nadawczymi o wysokim napieciu. Układ wzmacniaczy składa się z przedwzmacniacza niskoszumnego oraz wzmacniacza o regulowanym wzmocnieniu ZRW (zasięgowej regulacji wzmocnienia). Wzmacniacz ZRW pozwala na zmiane wzmocnienia w trakcie odbioru ech niwelując spadek amplitudy sygnału spowodowanym tłumieniem w tkance. Krzywa zasięgowej regulacji wzmocnienia ZRW steruje zmianą wzmocnienia z głębokościa. Sygnał analogowy w.cz. po wzmocnieniu może być demodulowany analogowo (rys, 3.17) lub digitalizowany i demodulowany cyfrowo (rys, 3.18). Demodulator analogowy jest realizowany w postaci układu prostownika i filtru dolnoprzepustowego. Sygnał po demodulatorze jest już tzw. sygnałem wideo linii obrazowej i jest na tym etapie poddawany filtracii oraz kompresii logarytmicznej. Logarytmiczna kompresia dynamiki powoduje spłaszczenie amplitud dużych sygnałów przy jednoczesnym "wyciągnieciu" amplitud małych ech, pozwalając na ich jednoczesną prezentację na ekranie. Należy pamiętać, że dynamika wyświetlaczy ekranowych wynosi 20-30 dB, a dynamika sygnału ech łatwo przekracza 60 dB (przy włączonym ZRW). Konstrukcja głowic ze skanowaniem mechanicznym powoduje, że linie wideo są zbierane w geometrii sektora (wycinek pierścienia), co powoduje że wyświetlanie ich na ekranie monitora wymaga przeprowadzenia konwersji geometrii do układu kartezjańskiego. Układ konwertera geometrii (tzw. scan-converter) może dodatkowo przeprowadzać interpolację przy wyliczaniu jasności punktów ekranowych obrazu, poprawiając jakość wyświetlanego obrazu. W prezentacji B (ang. B-mode) przetworzona amplituda sygnału ech jest wyświetlana w skali szarości lub w innej palecie kolorowej. Dodatkowo w aparatach stosowana jest cyfrowa obróbka sygnału i obrazu w celu poprawy jakości wyświetlanego obrazu.



Rysunek 3.17: Schemat blokowy toru obrazowego ultrasonografu z analogowym demodulatorem

### 3.3.2 Technologie cyfrowe w polskich aparatach

Obecnie w Polsce produkowane są aparaty klasy podstawowej lub średnio zaawansowanej z przetwarzaniem częściowo analogowym. Zaawansowane aparaty z w pełni cyfrowym przetwarzaniem sygnału (cyfrowym beamformerem) są domeną światowych potentatów (Philips, Siemens, Toshiba). Pomimo reprezentowania innej klasy urządzeń, krajowe aparaty są bardzo nowoczesne pod względem technologicznym (szczególnie Echo-Son S.A.). Widoczny jest trend do "digitalizacji" urządzeń – tj. coraz wcześniejszego cyfryzowania sygnału analogowego i dalszej obróbki cyfrowej. Klasycznie w ultrasonografach klasy podstawowej cyfryzacja sygnału jest realizowana po stopniach analogowych beamformera i demodulatora, czyli na tzw. sygnale wi-



Rysunek 3.18: Schemat blokowy toru obrazowego ultrasonografu z cyfrowym demodulatorem

deo. W najnowszych konstrukcjach Echo-Son S.A. cyfryzowany jest sygnał w.cz. po analogowym beamformerze przed demodulacją. Takie podejście daje nowe możliwości obróbki sygnału, ale znacząco zwiększa wymagania obliczeniowe systemu. W przypadku konstrukcji Echo-Son S.A. większość przetwarzania sygnału obrazowego jest realizowana w sposób sprzętowy przy pomocy programowalnych struktur logicznych FPGA. Jedynie niektóre stopnie przetwarzania wymagające bardziej złożonych algorytmów i charakteryzujące się mniejszą przepustowością są realizowane softwarowo za pomocą procesorów DSP. W szczególności do tego typu bloków należy przetwarzanie Dopplera (Power, Color Doppler), których implementacja w układach FPGA byłaby bardzo złożona i nieuzasadniona ze wzgledów wydajnościowych. Taka technologia realizacji przetwarzania cyfrowego jest optymalna w tej klasie urządzeń, ale niesie pewne ograniczenia rozwojowe. W szczególności implementacja bardziej złożonych metod obróbki sygnału w układach FPGA jest trudna i bardzo pracochłonna. Ponadto złożoność algorytmów pociąga za sobą złożoność układu FPGA, a to wiąże się z kosztami urządzenia oraz może wymagać zmian sprzętowych — stosowanie większych układów. Tak więc implementacja czysto sprzętowa toru przetwarzania cyfrowego jest trudna i wiaże się z dużymi kosztami realizacji oraz produkcii. Implementacia softwarowa nie tylko nie ma tych ograniczeń, ale otwiera nowe możliwości. Rozwój softwarowych algorytmów jest znacznie prostszy i może być realizowany w jezykach wysokiego poziomu, co wpływa na szybkość i koszty realizacji. Algorytmy softwarowe można także łatwiej uruchamiać i weryfikować na komputerach PC przed przeniesieniem ich na platforme docelowa (np. DSP). Uniwersalna platforma softwarowa może udostępniać możliwość realizacji algorytmów firmom trzecim i ośrodkom badawczym, co jest raczej nie do pomyślenia w przypadku rozwiązań sprzętowych.

Drugim producentem w Polsce jest firma Teson produkująca aparaty oparte na komputerze PC. Konstrukcja urządzeń na bazie PC jest dość popularna, ze względu na dużą bazę oprogramowania i obsługiwanych urządzeń zewnętrznych. Komputer PC wyposażony w system operacyjny (np. Microsoft Windows) bardzo dobrze nadaje się do realizacji zadań związanych z interfejsem użytkownika, wizualizacją, składowaniem, przesyłaniem (obsługa sieci komputerowych) oraz drukowaniem. Powszechna znajomość okienkowego interfejsu użytkownika ułatwia obsługę urządzeń opartych na Microsoft Windows. Wbudowane w aparaty Teson komputery PC realizują właśnie tego typu funkcje, realizacja przetwarzania cyfrowego jest ograniczona do funkcji wizualizacji (krzywe post processingu, zoom, filtry obrazowe).

W zakresie ultrasonografii wysokiej częstotliwości jedynym produkowanym w kraju aparatem jest *Desmin* firmy Echo-Son S.A., który został opracowany przy udziale Zakładu Ultradźwięków IPPT PAN (w tym autora). *Desmin* współpracuje z głowicą sektorową na 20 MHz i umożliwia obrazowanie do 5 mm. Główną aplikacją tego urządzenia jest dermatologia i oftalmologia.

# **Rozdział** 4

# Projekt systemu

Pierwotne założenia funkcjonalno-techniczne dla system ultrasonografu z transmisją kodowaną obejmowały następujące punkty:

- 1. Budowa kompletnego ultradźwiękowego systemu obrazującego z transmisją kodowaną.
- 2. Praca systemu w zakresie częstotliwości ultradźwiękowych 20–30 MHz.
- 3. Przetwarzanie i wyświetlanie w czasie rzeczywistym z prędkością co najmniej 5 klatek/s,
- 4. Wsparcie dla nadawania kodów z modulacją częstotliwości (chirp) i fazy (kody algebraiczne Barkera, Golaya),
- 5. Współpraca z sektorową głowicą mechaniczną (pojedynczy przetwornik).

Od początku przyjęto założenie, że system będzie składał się z modułu nadawania i akwizycji oraz komputera PC realizującego funkcje sterujące oraz wyświetlania. Sposób realizacji cyfrowego przetwarzania sygnałów, a w szczególności bardzo złożonego obliczeniowo algorytmu kompresji kodów, był sprawą otwartą. Ze względu na specyficzne wymagania modułu nadawania i akwizycji zdecydowano się na opracowanie całkowicie własnej elektroniki zamiast adaptacji dostępnych na rynku rozwiązań.

# 4.1 Architektura systemu

### 4.1.1 Tor przetwarzania ultrasonografu z transmisją kodowaną

Zastosowanie transmisji kodowanej wymaga gruntownych zmian w torze nadawczoodbiorczym ultrasonografu [34]. Klasyczny tor przetwarzania ultrasonografu przedstawiony w podrozdziale 3.3 (rys. 3.17, 3.18) wymaga następujących modyfikacji (rys. 4.1):

- Liniowy odbiornik. Kodowanie sygnału a następnie jego kompresja czasowa wymaga liniowości całego toru nadawczo-odbiorczego. W ultrasonografach z analogowym demodulatorem stosuje się wzmacniacz logarytmiczny, który kompresuje dynamikę sygnału wideo, co pozwala na digitalizację sygnału za pomocą przetworników A/C o mniejszej liczbie bitów (zwykle 6–8-bitowych).
- Liniowy wzmacniacz mocy. W aparatach z nadawaniem klasycznym do generacji sygnałów nadawczych stosowane są układy generatorów impulsowych wysokiego napięcia.

Przy nadawaniu kodowanym wymagany jest generator sygnałów modulowanych częstotliwościowo i/lub fazowo oraz liniowy wzmacniacz mocy. Konstrukcja liniowego i szerokopasmowego wzmacniacza mocy na zakres wysokich częstotliwości jest szczególnie trudna.

- Generator sygnałów kodowanych. W zależności od stosowanych sygnałów kodowanych wymagany jest programowalny generator z modulacją częstotliwości i/lub fazy. Alternatywą jest w pełni arbitralny generator sygnałów umożliwiający generację dowolnych przebiegów.
- Akwizycja sygnału w.cz. o dużej dynamice. Wzmocniony w sposób liniowy sygnał w.cz. ech charakteryzuje się dużą dynamiką (> 60 dB), dlatego konieczne jest stosowanie przetworników A/C co najmniej 10-bitowych. Próbkowanie sygnału w.cz. wymaga także zachowania odpowiednio wysokiej częstotliwości próbkowania — w praktyce przyjmuje się, że prędkość próbkowania powinna wynosić 3–5 krotność częstotliwości stosowanych ultradźwięków.
- Kompresja sygnałów kodowanych. Cyfrowy sygnał w.cz. ech w transmisji kodowanej musi zostać skompresowany czasowo w celu odzyskania rozdzielczości. Algorytm kompresji polega na korelacji sygnału ech z sygnałem nadawczym (kodem). Realizacja tego algorytmu w czasie rzeczywistym wymaga bardzo wydajnego systemu obliczeniowego.



Rysunek 4.1: Schemat blokowy toru obrazowego ultrasonografu z transmisją kodowaną

Powyższe zmiany nie są prostą modyfikacją obecnych urządzeń i wymagają zupełnie nowego opracowania układów nadawczych oraz przetwarzania sygnałów. Te poważne i kosztowne modyfikacje powodują, że producenci sprzętu ultrasonograficznego nie śpieszą się z wdrażaniem techniki transmisji kodowanej w aparatach [49].

### 4.1.2 Analiza rozwiązań

Ogólna architektura zaprojektowanego systemu ultrasonografu została przedstawiona na rys. 4.2. Analizę rozwiązań przeprowadzono mając na uwadze możliwości realizacji (dostępne środki, sprzęt oraz doświadczenie).



Rysunek 4.2: Schemat blokowy opracowanego systemu ultrasonografu z transmisją kodowaną

Najważniejszą decyzją projektową był wybór środków cyfrowego przetwarzania sygnałów (w tym kompresji kodów). Przeanalizowano dostępne rozwiązania (rozdział 3) i podjęto prace mające na celu ustalenie możliwości softwarowej implementacji przetwarzania cyfrowego na komputerze PC. W tym celu zaimplementowano w języku C modelowy algorytm kompresji kodów przy pomocy bibliotek *Intel IPP* [70]. Biblioteki *Intel IPP* wykorzystują rozszerzenia multimedialne procesorów x86 zapewniając maksymalną możliwą do uzyskania wydajność funkcji numerycznych dla obliczeń na wektorach. Procedurę filtracji dopasowanej będącą podstawą kompresji kodów zrealizowano na dwa sposoby: jako korelację w dziedzinie cząstotliwości przez mnożenie transformat Fouriera (szczegóły implementacji modelowej i docelowej są przedstawione w 4.7). Testy zaimplementowanych algorytmów kompresji ech przeprowadzono na komputerze PC z procesorem Pentium 4 HT z zegarem 3,06 GHz i 1 MB pamięci podręcznej, szyną procesora o częstotliwości 800 MHz i 1 GB pamięci operacyjnej DDR-SDRAM PC3200. Dane wejściowe były ładowane do pamięci z plików ze spróbkowanymi w trybie off-line echami. Testy przeprowadzono w następujących warunkach:

- kompresja kodów Golaya (podwójna filtracja dopasowana),
- testy bezpośrednio w pamięci tj. bez uwzględnienia czasu ładowania danych z plików,
- mierzono średni czas kompresji jednego pełnego obrazu składającego się z 256 linii po 2048 próbek każda, dla długości kodów 25, 50, 100, 200 i 300 próbek,
- w przypadku metody działającej w dziedzinie częstotliwości spektra kodów były wstępnie obliczone (tj. nie były obliczane dla każdej linii).

Wyniki pomiarów przedstawiono na wykresie (rys. 4.3). Średni czas kompresji pojedynczego obrazu dla metody w dziedzinie częstotliwości wyniósł ok. 15 ms, dla metody w dziedzinie czasu zawierał się w zakresie od 15 ms dla kodu o długości 25 próbek do 125 ms dla kodu o długości 300 próbek. Jak widać z wykresu jedynie dla bardzo krótkich kodów (długości mniejszej od 25 próbek) obliczenia w dziedzinie czasu stają się szybsze od metody w dziedzinie częstotliwości. Dla praktycznie użytecznych kodów o długościach powyżej 100 próbek metoda w dziedzinie częstotliwości ma znaczącą przewagę. Uzyskana wydajność algorytmu kompresji ech okazała się więcej niż wystarczająca do realizacji obrazowania w czasie rzeczywistym. Zmierzone czasy przetwarzania pozostawiają szeroki margines na dodatkowe operacje związane z transmisją danych oraz procesem wyświetlania obrazu dla założonej minimalnej prędkości wyświetlania obrazu 5 ramek/s.

Rozwiązanie zagadnienia realizacji kompresji kodów w czasie rzeczywistym na komputerze PC pozwoliło na uproszczenie modułu nadawania i akwizycji. Ponieważ softwarowa wydajność



Rysunek 4.3: Porównanie szybkości realizacji kompresji kodów (filtracji dopasowanej) w dziedzinie czasu i częstotliwości

obliczeń okazała się wystarczająca, nie są konieczne dodatkowe układy (procesory) dedykowane do przetwarzania sygnałów w module. W ten sposób zadania modułu ograniczyły się do generacji sygnałów nadawczych oraz akwizycji ech i transmisji danych do PC. Moduł został oparty na programowalnym układzie logicznym FPGA, który zapewnia niezbędne zasoby do realizacji tych funkcji. Duża częstotliwość pracy układów przetworników A/C i C/A wymaga sprzętowego układu kontrolera i układ FPGA jest w tym wypadku jedynym rozwiązaniem. Pod uwagę była brana możliwość zaadoptowania/rozbudowy gotowych modułów ewaluacyjnych z układami FPGA dostępnych na rynku. Po analizie zdecydowano się jednak na budowę w całości własnej elektroniki, jako rozwiązania bardziej optymalnego i przyszłościowego.

Do generacji nadawczych sygnałów kodowanych rozważano dwa rozwiązania: układ cyfrowej syntezy częstotliwości DDS (ang. Direct Digital Synthesis) [8] oraz generator przebiegów arbitralnych. Na rynku są dostępne gotowe układy DDS umożliwiające generację sygnałów sinusoidalnych oraz modulowanych fazowo i częstotliwościowo (np. AD9854 [12]). Niestety dostępne (w momencie rozpoczynania projektu) układy DDS nie umożliwiały modulacji amplitudy sygnału. Oczywiście taka modulacja może być zrealizowana zewnętrznie, ale wymaga to dodatkowego przetwornika C/A oraz kolejnego układu generatora obwiedni sygnału, co niweluje korzyści zastosowania jednego układu DDS. Zaletą generatora arbitralnego jest pełna dowolność, co do kształtu sygnału nadawczego. Ponieważ zasoby pamięciowe zastosowanego układu FPGA pozwalały na realizację generatora arbitralnego, zdecydowano się na to rozwiązanie. Dodatkowo w celu zapewnienia pełnej kontroli nad wzmocnieniem sygnału odbiorczego zastosowano drugi układ generatora arbitralnego do sterowania zasięgową regulacją wzmocnienia.

Kolejnym zagadnieniem był wybór metody próbkowania sygnału ech w.cz. oraz samego układu przetwornika A/C. Istnieje wiele metod próbkowania sygnałów pasmowych — m.in. próbkowanie szerokopasmowe, wąskopasmowe, kwadraturowe, Hilberta [25]. W systemach ultradźwiękowych mamy co prawda do czynienia z dobrze określonym pasmem sygnału skupionym wokół częstotliwości podstawowej i wynikającym bezpośrednio z pasma głowicy, jednak pasma te mogą być bardzo szerokie (przekraczać 100%), co ogranicza zastosowanie próbkowania wąskopasmowego. Próbkowanie kwadraturowe jest interesujące ponieważ za jego pomocą uzyskuje się od razu sygnał analityczny. Niestety do uzyskania kwadratury potrzebne są metody analogowe (mieszacze) albo triki próbkowania z poczwórną częstotliwością (co pozwala na uzyskanie przesunięcia o  $\pi/2$ ), które są rozwiązaniami dalekimi od ideału. Jeszcze innym rozwiązaniem są metody pod-próbkowania (ang. undersampling), które pozwalają na stosowanie niższej częstotliwości próbkowania i automatyczne przesuwanie pasma. One z kolei wymagają ściśle ustalonych częstotliwości próbkowania związanych z częstotliwością środkową, co wymaga stosowania specjalnych układów generacji zegara. Po analizie dostępnych na rynku układów przetworników A/C i nie chcąc ograniczać możliwości zastosowań modułu zdecydowano się na próbkowanie szerokopasmowe. Próbkowanie szerokopasmowe stawia wysokie wymagania na prędkość próbkowania, która w praktycznych zastosowaniach ultradźwiękowych powinna być 3–5 razy wyższa od częstotliwości środkowej głowicy, ale jednocześnie pozwala na digitalizację sygnałów w całym paśmie bez żadnych ograniczeń. Wyselekcjonowano rodzinę przetworników A/C MAX1213/4/5 firmy Maxim, która zapewnia 12-bitową rozdzielczość oraz częstotliwość próbkowania w zakresie 170–250 MHz.

Innym newralgicznym elementem systemu był interfejs komunikacyjny pomiędzy modułem, a komputerem PC. Zapewnienie wizualizacji w czasie rzeczywistym wymaga przesyłania w sposób płynny dużej ilości danych cyfrowych (sygnałów w.cz.). Do komunikacji wykorzystano interfejs USB 2.0 pracujący w trybie *High-Speed*, który był już przez autora wykorzystywany w innym projekcie i którego przepustowość okazała się wystarczająca.

Analogowe układy nadawczo-odbiorcze oraz sam moduł kodera-digitizera zostały rozdzielone w celu zapewnienia większych możliwości adaptacji elementów systemu. Układy analogowe opracowano na podstawie wcześniejszych rozwiązań stosowanych w poprzednim modelu mikrosonografu.

Poniżej, w kolejnych podrozdziałach, opisano dokładnie elementy składowe systemu.

# 4.2 Moduł kodera-digitizera

Moduł kodera-digitizera realizuje następujące funkcje:

- koder generacja nadawczych sygnałów kodowanych,
- digitizer układ przetwarzania A/C do akwizycji sygnałów ech,
- sterowanie zasięgową regulacją wzmocnienia (ZRW) odbiornika,
- sterowanie wzmocnieniem odbiornika oraz ruchem głowicy,
- synchronizacja procesu nadawania i odbioru linii obrazowych z sygnałami położenia przetwornika z głowicy ultradźwiękowej,
- transmisja danych do PC.

Na rys. 4.4 przedstawiono schemat blokowy opracowanego modułu (schemat ideowy modułu znajduje się w dodatku A). Moduł został zrealizowany na 4-warstwowej płytce drukowanej o rozmiarach 90 mm × 90 mm (rys. 4.5).

### 4.2.1 Przetwornik analogowo-cyfrowy

Digitalizacja sygnałów ech w.cz. w naszym zastosowaniu wymagała użycia przetwornika A/C o dużej dynamice (co najmniej 10-bitów) i szybkości przetwarzania (co najmniej 150 MSPS). Wybrano układ z rodziny MAX1213/4/5 firmy Maxim, o rozdzielczości 12-bitów i prędkości przetwarzania od 170 MSPS (dla MAX1213) do 250 MSPS (dla MAX1215) [81]. Przetworniki te



Rysunek 4.4: Schemat blokowy modułu kodera-digitizera



Rysunek 4.5: Widok zmontowanej płytki modułu kodera-digitizera

są zrealizowane w architekturze potokowej (rys. 4.6), posiadają wewnętrzne źródło napięcia odniesienia, układ śledząco-próbkujący oraz układ stabilizacji zegara.



Rysunek 4.6: Schemat blokowy układu przetwornika analogowo-cyfrowego MAX1215 [81]

Układy MAX1213/4/5 wymagają pojedynczego zasilania o napięciu 1,8V, a ich całkowita moc wydzielana wynosi 1W dla maksymalnej częstotliwości pracy. Stopień wejściowy przetwornika A/C jest przystosowany do pracy w systemie 50  $\Omega$ , który jest stosowany w zakresie częstotliwości radiowych. W module kodera-digitizera na wejściu przetwornika zastosowano układ zalecany w nocie aplikacyjnej [81] przedstawiony na rys. 4.7. Zastosowanie podwójnego transformatora w.cz. przyczynia się do zmniejszenia zniekształceń nieliniowych związanych z nieidealną charakterystyką transformatorów.



Rysunek 4.7: Zalecany układ wejściowy przetwornika MAX1215 [81]

Przetworniki MAX1213/4/5 są wyposażone w równoległy interfejs cyfrowy w standardzie LVDS (ang. Low Voltage Differential Signaling). Zaletą interfejsu różnicowego LVDS są małe szumy elektryczne dzięki stosowaniu mniejszych wartości napięcia poziomów cyfrowych (ok. 400 mV), wadą podwójna liczba sygnałów w stosunku do zwykłych (nieróżnicowych) interfejsów [93]. Na rys. 4.8 pokazano zależności czasowe próbkowania przetwornika A/C. Opóźnienie (latencja) wyjścia cyfrowego w stosunku do momentu próbkowania analogowej wartości napięcia na wejściu wynosi 11 okresów zegara, co jest związane z architekturą potokową przetwornika. Ponieważ opóźnienie to jest stałe może zostać uwzględnione i skorygowane w procesie synchronizacji nadawania-akwizycji.



Rysunek 4.8: Zależności czasowe próbkowania dla przetwornika MAX1215 [81]

### 4.2.2 Przetworniki cyfrowo-analogowe

W module zastosowano dwa identyczne przetworniki C/A typu AD9744 firmy Analog Devices o rozdzielczości 14-bitów i prędkości przetwarzania 210 MSPS [9]. Przetworniki pracują z zasilaniem 3,3 V i pobierają do 135 mW mocy. Podobnie jak w przypadku przetworników A/C, wyjście układów AD9744 jest przystosowane do obciążenia 50  $\Omega$  sprzęgniętego przez transformator w.cz. Wejściowy interfejs cyfrowy pracuje w standardzie LVCMOS33 (ang. Low Voltage CMOS).

Pierwszy z przetworników służy do generacji arbitralnych sygnałów kodowanych, drugi do sterowania ZRW. Przetwornik C/A do sterowania ZRW pracuje ze znacznie mniejszą prędkością, jednak zastosowanie jednego modelu przetwornika do obu celów służyło uproszczeniu konstrukcji.

### 4.2.3 Układ FPGA

Obecnie na rynku dostępna jest ogromna różnorodność układów FPGA zoptymalizowanych do różnych zastosowań. Ograniczając się do jednego producenta firmy Xilinx można wyróżnić układy ekonomiczne (rodzina Spartan) oraz układy do wymagających zastosowań (rodzina Virtex). Chcąc ograniczyć koszty elementów modułu oraz jego produkcji zdecydowano się na układy Spartan-3 w klasycznych obudowach z nóżkami PQFP. Zastosowanie układów o mniejszych zasobach (a tym samym mniejszym poborze prądu) i wyprowadzeniach z nóżkami (zamiast obudów BGA) pozwoliło na ograniczenie liczby warstw płytki drukowanej do czterech, co znacznie obniżyło koszty produkcji i montażu modułu. Zastosowany model układu Xilinx XC3S400TQ144 [149] dysponuje następującymi zasobami:

- 96 cyfrowych sygnałów wej./wyj.,
- 400 k równoważnych bramek logicznych,
- 288 kbit pamięci blokowej RAM,

- 56 kbit pamięci rozproszonej RAM,
- 4 układy zarządzania zegarem DCM (ang. Digital Clock Management),
- 16 dedykowanych układów mnożących.

Układy Spartan-3 wymagają trzech niezależnych napięć zasilania: 1,2 V dla jądra, 2,5 V dla układów pomocniczych oraz 3,3 V dla portów wej./wyj. w standardzie LVCMOS33. Całkowity pobór prądu układu zależy bardzo silnie od częstotliwości pracy i wykorzystania zasobów układu. Oszacowanie pobieranej mocy można uzyskać za pomocą arkusza kalkulacyjnego *Xilinx Power Estimator* [151], dostarczanego przez Xilinx, po wprowadzeniu danych dotyczących wykorzystania zasobów i częstotliwości pracy. Dokładniejsze określenie zapotrzebowania na moc uzyskuje się w oprogramowaniu do projektowania układów — Xilinx *ISE*, po zaimplementowaniu projektu.

### 4.2.3.1 Projekt wewnętrzny układu FPGA

Układ FPGA jest centralnym elementem modułu kodera-digitizera — do niego podłączone są pozostałe elementy: układy przetworników A/C i C/A oraz układ interfejsu USB. Projekt wewnętrzny FPGA może być łatwo modyfikowany do konkretnych potrzeb i ładowany z komputera PC przez interfejs USB w trakcie pracy urządzenia.

Obecnie zaimplementowany projekt FPGA (funkcja ultrasonografu z transmisją kodowaną) realizuje następujące zadania:

- Generowanie arbitralnych sygnałów kodowanych układ FPGA generuje przebiegi z wewnętrznej pamięci blokowej RAM, której zawartość jest z kolei programowalna z komputera PC. Układ może generować jeden lub dwa różne kody o długości do 1024 próbek, co zapewnia wsparcie dla komplementarnych kodów Golaya.
- 2. Digitalizacja ech dane jednej linii sygnału w.cz. ech z przetwornika A/C są składowane w wewnętrznej pamięci FIFO, a następnie transferowane do komputera PC przez kontroler interfejsu USB. Bufor FIFO ma rozmiar 8192 próbek, co pozwala na zapamiętanie jednej linii o takiej długości lub dwóch kolejnych linii o długości 4096 próbek przy podwójnym nadawaniu dla kodów Golaya.
- 3. Synchronizacja nadawania i odbioru z ruchem głowicy proces akwizycji obrazu wymaga synchronizacji procesu nadawania i odbioru każdej linii sygnału w.cz. z sygnałem położenia głowicy. Głowica wyposażona jest w enkoder optyczny, który generuje impulsy linii oraz sygnał zera głowicy (pozycja krańcowa). Sygnał linii z enkodera głowicy wyzwala procedurę nadania kodu, odliczenia opóźnienia, a następnie akwizycji echa z głowicy.
- 4. Transfer danych do komputera PC cyfrowy sygnał w.cz. z wewnętrznego bufora FIFO jednej linii obrazowej jest przesyłany do układu kontrolera interfejsu USB, a następnie dalej przez interfejs USB do komputera. Układ FPGA monitoruje stan komunikacji USB i przesyła kolejne porcje danych gdy tylko kontroler interfejsu USB zasygnalizuje wysłanie poprzedniej porcji danych.
- 5. Konfiguracja parametrów pracy proces nadawania i akwizycji może być konfigurowany w układzie FPGA z komputera. Do konfigurowalnych parametrów należą: typ nadawania (pojedyncze, podwójne), kształt nadawczego sygnału kodowanego, opóźnienie okna akwizycji w stosunku do nadawania, liczba próbek linii obrazowej, liczba linii obrazowych, kształt krzywej ZRW, wzmocnienie odbiornika i sterowanie pracą głowicy.

Metodologię projektowania układów FPGA przedstawiono w rozdziale 3.1.1. Projekt został stworzony w języku VHDL przy pomocy narzędzi Xilinx *ISE*. W projekcie wykorzystano generator bloków IP (*CoreGen*) do wygenerowania standardowych układów pamięci oraz pamięci FI-FO (ang. First In First Out) w oparciu o zasoby pamięci blokowej RAM. Schemat bloków VHDL projektu FPGA przedstawiono na rys. 4.9.



Rysunek 4.9: Schemat modułów VHDL projektu układu FPGA

#### Implementacja

Oprogramowanie Xilinx *ISE* przeprowadza automatyczną syntezę, mapowanie oraz umieszczanie i łączenie bloków logicznych i zasobów na podstawie dostarczonego projektu VHDL oraz pliku UCF (ang. User Constraints File — plik więzów użytkownika). Plik więzów określa wymagane parametry czasowe projektu (np. czasy propagacji sygnału, częstotliwość pracy) oraz konfigurację sygnałów wej./wyj. (np. przypisanie sygnałów do określonych wyprowadzeń). Oprogramowanie wykorzystuje algorytmy heurystyczne do implementacji projektu w taki sposób, aby spełnić narzucone więzy. Oczywiście spełnienie wszystkich ograniczeń może być niemożliwe, co jest sygnalizowane. Użytkownik może także pomóc oprogramowaniu przez manualne umieszczenie konkretnych bloków projektu w określonych miejscach układu FPGA. Dzięki temu implementacja może trwać krócej (gdyż pewne elementy są już z góry umieszczone) oraz może zakończyć się sukcesem spełnienia narzuconych ograniczeń. Osiągnięcie sukcesu w implementacji układów FPGA, czyli tzw. domknięcia czasowego (ang. Timing Closure) jest trudne i wymaga dużego doświadczenia.

W realizowanym projekcie jednym z najważniejszych narzuconych ograniczeń była częstotliwość zegara próbkowania równa 200 MHz. Należy zaznaczyć, że ta częstotliwość jest bardzo bliska maksymalnej częstotliwości pracy układów Spartan-3, co powoduje, że uzyskanie domknięcia czasowego było szczególnie trudne. Po przeprowadzeniu wielu implementacji z różnymi ustawieniami parametrów optymalizacji oprogramowania oraz ułożeniem bloków pamięci udało się uzyskać założoną prędkość pracy.

Wykorzystanie zasobów zastosowanego układu FPGA przez projekt jest nierównomierne (tabela 4.1). Widać, że pewne zasoby są wykorzystane w dużym procencie (zasoby wej./wyj., bloki pamięci), natomiast inne (bloki logiczne) w bardzo małym. Układy FPGA są dostępne w określonych konfiguracjach zasobów, które nie zawsze pasują do konkretnego zastosowania. Zaimplementowany projekt wykorzystuje bloki pamięci jako bufory dla sygnałów nadawczych, odbiorczych oraz krzywej ZRW. Funkcje logiczne realizujące synchronizację procesów są sto-sunkowo proste dzięki czemu mogą pracować z maksymalną częstotliwością.

| Zasób                    | Dostępnych | Wykorzystanych | Udział |
|--------------------------|------------|----------------|--------|
| Liczba bloków wej./wyj.  | 93         | 97             | 95%    |
| Liczba bloków RAM        | 11         | 16             | 68%    |
| Liczba sygnałów GCLK     | 3          | 8              | 37%    |
| Liczba bloków DCM        | 1          | 4              | 25%    |
| Liczba bloków logicznych | 325        | 3584           | 9%     |

Tabela 4.1: Wykorzystanie zasobów FPGA w projekcie kodera-digitizera

### 4.2.4 Układ zegara

Całość modułu, w szczególności układ FPGA oraz układy przetworników A/C i C/A są synchronizowane za pomocą wspólnego zegara. Jakość sygnału zegara ma ogromne znaczenie dla przetwarzania A/C sygnałów w.cz., co opisano w podrozdziale 3.2.3.3.

Od samego początku odrzucono pomysł dystrybucji zegara do przetwornika przez układ FPGA. Sygnały wyjściowe układów FPGA charakteryzują się jitterem na poziomie 33–50 ps i nie nadają się do dystrybucji zegara [26, 127]. Układy Xilinx Spartan-3 zawierają także wewnętrzne bloki generacji zegara oparte na pętlach DLL (ang. Delay Locked Loops), ale ich parametry jittera są jeszcze gorsze 200 ps [148]. Chcąc mieć możliwość regulacji częstotliwości próbkowania w szerokim zakresie w pierwszym prototypie modułu zastosowano uniwersalny programowalny układ generatora zegara Cypress CY22393 [41]. Niestety jego parametry, a zwłaszcza jitter okazały się znacznie gorsze od oczekiwanych, co eksperymentalnie stwierdzono przy pomiarach jakości przetwarzania analogowo-cyfrowego 5.1. Dlatego w kolejnej wersji zastąpiono go układem generatora o małym jitterze Epson EG-2121 z wyjściem typu LVDS podłączonym bezpośrednio do przetwornika A/C. Obecnie na rynku pojawiły się nowe układy generacji i kondycjonowania sygnału zegara [96], które zapewniają odpowiednią jakość do synchronizacji precyzyjnych przetworników A/C dla sygnałów w.cz. Obecnie poddaję badaniom jeden z takich układów — AD9517 [11], który zamierzam zastosować w kolejnej wersji modułu.

# 4.2.5 Interfejs USB

Przetwarzanie sygnału w.cz. w komputerze PC w czasie rzeczywistym wymaga dostarczania w takim samym reżimie czasowym danych do przetwarzania. W zależności od prędkości głowicy i długości linii sygnału w.cz. wymagana przepustowość zawiera się w przedziale 10–30 MB/s. Interfejs USB jest obecnie bardzo popularny i w trybie *High-Speed* zapewnia wymaganą przepustowość. Ponadto, interfejs USB sprawdził się we wcześniejszym projekcie — transmisja obrazów z ultrasonografu do PC.

Specyfikacja interfejsu i protokołu komunikacyjnego USB jest bardzo rozbudowana i złożona [17, 61]. W module zastosowano układ kontrolera interfejsu USB typu CY7C68013A firmy Cypress [42], który znany jest także pod nazwą kodową FX2. O wyborze tego układu zdecydowały wcześniejsze doświadczenia oraz dostępność sterownika USB dla systemu Microsoft Windows, który jest dostarczany przez producenta nieodpłatnie.

#### 4.2.5.1 Budowa i cechy kontrolera FX2

Kontroler FX2 jest zgodny z wersją 2.0 specyfikacji USB i wspiera wszystkie tryby pracy oraz metody transmisji USB — blokową (ang. bulk), przerwaniową (ang. interrupt) i izochroniczną (ang. isochronous). Układ oprócz kontrolera interfejsu (rys. 4.10) zawiera także wbudowany mikrokontroler zgodny ze standardem przemysłowym 8051, 16 kB pamięci RAM oraz dodatkowe peryferia ogólnego przeznaczenia (interfejs I2C, asynchroniczny port szeregowy, porty wej./wyj.) i specjalizowany interfejs GPIF/FIFO zapewniający bezpośredni dostęp do kanału komunikacji USB.

Wbudowany mikrokontroler 8051 wykonuje program w pamięci RAM, która może być załadowana z pamięci nieulotnej EEPROM podłączonej do interfejsu I2C lub bezpośrednio przez USB. Ta druga możliwość jest szczególnie interesująca gdyż pozwala na przygotowanie oprogramowania kontrolera w postaci pliku na dysku komputera, który jest automatycznie (po podłączeniu modułu z FX2) ładowany do układu. Dzięki temu urządzenie USB może być ładowane różnym wersjami firmware (oprogramowaniem wbudowanym) i realizować różne funkcje, bez konieczności fizycznego przeprogramowania urządzenia. Mikrokontroler realizuje funkcje obsługi protokołu USB (enumeracja, wymiana komunikatów kontrolnych, itp.) oraz może za pomocą portów wej./wyj. sterować pracą innych układów. W naszym rozwiązaniu mikrokontroler odpowiada także za uruchamianie i programowanie układu FPGA danymi z komputera PC, a następnie za kontrolę parametrów jego pracy (parametry nadawania i akwizycji). Takie rozwiązanie pozwala na zmianę funkcji układu FPGA (pełne przeprogramowanie!) w trakcie pracy modułu, bez konieczności resetowania go czy odłączania od komputera. Pełne przeprogramowanie FPGA trwa ułamek sekundy.

#### 4.2.5.2 Oprogramowanie kontrolera interfejsu USB

Producent kontrolera FX2 dostarcza do niego sterownik [40] dla systemu Windows, bibliotekę aplikacyjną [39] oraz przykłady programowania wbudowanego mikrokontrolera. Autor korzystając z tych narzędzi zaimplementował oprogramowanie sterujące mikrokontrolera oraz biblioteki wyższego poziomu dla systemu Windows zapewniające komunikację przez USB. Zrealizowane oprogramowanie zapewnia uniwersalne funkcje komunikacyjne:

- programowanie układu FPGA,
- przesyłanie krótkich komunikatów sterująco-kontrolnych,
- ustawianie rejestrów układu FPGA,
- wydajną transmisję strumieniową (ciągłą) pomiędzy układem FPGA a komputerem PC.



Rysunek 4.10: Schemat blokowy układu kontrolera interfejsu USB — Cypress CY7C68013A [42]

# 4.2.6 Zasilanie modułu

Moduł kodera-digitizera wymaga pojedynczego napięcia zasilania (5 V), które może być dostarczone z komputera PC przez port USB lub z zasilacza zewnętrznego. Całkowity pobór prądu modułu w stanie spoczynku nie przekracza 250 mA, a w trakcie pracy 350 mA. Wszystkie napięcia potrzebne do zasilania układów modułu są wytwarzane na płytce modułu tj.:

- 3,3 V dla FPGA, przetworników C/A, kontrolera USB,
- 2,5 V dla FPGA,
- 1,8 V dla przetwornika A/C,
- 1,2 V dla FPGA.

Do wytworzenia napięć zasilania wykorzystano układy liniowych stabilizatorów o małym spadku napięcia: National LM1086-3.3 [94] dla napięcia 3,3 V i LM1117-2.5 [95] dla 2,5 V oraz stabilizator impulsowy Microchip MCP1612 [85] dla napięć 1,8 V i 1,2 V.

# 4.3 Analogowe układy wej./wyj.

Schematy bloków analogowych wzmacniacza wejściowego oraz wyjściowego wzmacniacza mocy zamieszczono w dodatku A.

# 4.3.1 Wzmacniacz mocy

Wzmacniacz mocy pracuje w paśmie do  $35\,\rm MHz$ i dysponuje na wyjściu nominalnym napięciem międzyszczytowym do  $80\,\rm V.$ 

# 4.3.2 Wzmacniacz odbiorczy

Układ odbiorczy składa się z przedwzmacniacza umieszczonego w obudowie głowicy o wzmocnieniu ok. 10 dB oraz wzmacniacza odbiorczego o wzmocnieniu 65 dB i paśmie 18–45 MHz.

# 4.4 Układy zasilania

Zasilanie całego systemu mikrosonografu (modułu, układów analogowych, głowicy) wymagało zastosowania dedykowanego zasilacza. Czułe wejściowe układy analogowe potrzebują zasilania symetrycznego o małym poziomie szumów, natomiast analogowy wzmacniacz mocy symetrycznego wysokiego napięcia 40 V (rys. 4.11).



Rysunek 4.11: Schemat blokowy układów zasilania mikrosonografu

# 4.5 Panel regulacyjny

Na podstawie naszych wcześniejszych doświadczeń i opinii użytkowników wiemy, że regulacja podstawowych parametrów urządzenia jest znacznie wygodniejsza za pomocą klasycznych pokręteł. Dlatego został opracowany panel regulacyjny (rys. 4.12), który jest opcjonalnym wyposażeniem systemu mikroultrasonografu. Oprogramowanie kontrolno-sterujące pozwala na regulację wszystkich parametrów w graficznym interfejsie użytkownika za pomocą myszki i klawiatury, co pozwala na pracę bez podłączonego panelu.

Panel posiada 5 niezależnych pokręteł, które standardowo są przypisane do regulacji następujących parametrów:

- głębokości obrazowania,
- wzmocnienia odbiornika,
- głębokości zadziałania ZRW,
- poziomu ZRW,
- cyfrowej kompresji jasności.

### 4.5.1 Budowa panelu

Panel został zbudowany na bazie uniwersalnego modułu z mikrokontrolerem jednoukładowym Atmel z rodziny SAM7S [16]. Mikrokontroler SAM7S zawiera 32-bitowe jądro



Rysunek 4.12: Widok panelu regulacyjnego USB

ARM7TDMI [14], pamięć RAM (do 64 kB), pamięć flash (do 512 kB) oraz zestaw peryferiów (m.in. interfejs USB, interfejs SPI, interfejs I2C, porty wej./wyj.). Schemat blokowy panelu przedstawiono na rys. 4.13.



Rysunek 4.13: Schemat blokowy panelu regulacyjnego mikrosonografu

Pokrętła, będące enkoderami mechanicznymi o 20 impulsach na obrót, zostały podłączone bezpośrednio do portów cyfrowych mikrokontrolera. Oprogramowanie wbudowane (zapisane w pamięci flash) realizuje funkcje odczytu położenia enkoderów oraz komunikacji USB z komputerem PC. Zastosowane enkodery generują informację o obrocie względnym i kierunku obrotu. Aplikacja odczytuje informację o względnej zmianie położenia pokręteł w stosunku od ostatniego odczytu. Zastosowanie dodatkowego znacznika czasowego pozwala na realizację funkcji akceleracji — polegającej na dużej zmianie nastawy przez niewielki, ale szybki obrót pokrętła. Panel jest widoczny w systemie Microsoft Windows jako wirtualny port szeregowy. Zdefiniowany protokół komunikacji pozwala na współpracę z aplikacją.

# 4.6 Głowica ultradźwiękowa

System mikrosonografu współpracuje obecnie z mechaniczną głowicą sektorową zaadoptowaną z aparatów Desmin produkcji Echo-Son S.A.. Głowica ta została wyposażona w nowy przetwornik wysokiej częstotliwości oraz układ przedwzmacniacza. Głowica mechaniczna jest napędzana wewnętrznym silnikiem prądu stałego ze zintegrowanym enkoderem optycznym, który generuje impulsy linii oraz sygnał jednej z pozycji krańcowych. Sygnały synchronizacji z głowicy są podłączone do modułu kodera-digitizera (układu FPGA). Ponieważ synchronizacja nadawania/odbioru została zrealizowana w układzie FPGA istnieje łatwość jej modyfikacji np. w celu podłączenia innej głowicy. Obecnie jest opracowywana prototypowa głowica ze skanowaniem liniowym, która ma współpracować z aparatem.

Prędkość akwizycji obrazów jest uzależniona od prędkości ruchu głowicy i może być w pewnym zakresie regulowana przez napięcie zasilania silnika głowicy. Ze względu na ograniczenia transferu danych obecnie prędkość jest ustawiona na ok. 7 Hz.

### 4.6.1 Przetwornik ultradźwiękowy

W głowicy zastosowano przetwornik ultradźwiękowy wykonany przez firmę Ferroperm nową technologią grubych warstw (ang. thick-film) [73]. Technika grubych warstw polega na nakładaniu warstw emulsji PZT na podkład/blok ceramiki. Kontrolując sposób nanoszenia warstw i/lub ich liczbę można wpływać na częstotliwość przetwornika. Zakład Ultradźwięków brał udział w europejskim projekcie MINUET, w którym realizował badania tych nowych przetworników. Zastosowanie przetworników thick-film w mikrosonografie jest pierwszą praktyczną aplikacją tej technologii (rys. 4.14). Przetworniki z grubych warstw charakteryzują się bardzo szerokim pasmem, co jest szczególnie korzystne w zastosowaniach transmisji kodowanej.



Rysunek 4.14: Widok przetwornika zamocowanego w głowicy

Na rys. 4.15 pokazano odpowiedź impulsową jednego z prototypowych przetworników o średnicy 4 mm i częstotliwości rezonansowej 20 MHz. Impuls od reflektora metalowego w wodzie został zmierzony przy pomocy nadajnika/odbiornika *JSR DPR300* oraz oscyloskopu cyfrowego *Agilent 54641D*. Przetwornik był podłączony przez kabel koncentryczny o długości 130 cm.

Używane do zastosowań obrazowych przetworniki były ogniskowane (8–14 mm) za pomocą krzywizny powierzchni przedniej. Czoło przetwornika miało napyloną warstwę dopasowującą będącą jednocześnie zabezpieczeniem. Przetwornik pracuje przez kąpiel wodną i specjalnie dobraną cienką folię spożywczą — ze względu na wysokie tłumienie nie można zastosować konstrukcji z kąpielą olejową.



Rysunek 4.15: Odpowiedź impulsowa przetwornika na 20 MHz

# 4.6.2 Geometria głowicy

Jak już wspomniano głowica generuje sygnały linii (położenia przetwornika) przy pomocy enkodera zainstalowanego na silniku napędowym. Impulsy z enkodera są generowane co stały kąt obrotu silnika — 256 impulsów na obrót. Układ mechaniczny przeniesienia napędu zamienia jeden obrót silnika na ruch wahadłowy przetwornika (sektor) o kącie 27°. Transformacja ruchu nie jest liniowa, co powoduje, że gęstość zbieranych linii (wyzwalanych przez enkoder) jest bardzo nierównomierna w sektorze (rys. 4.16). Ponieważ gęstość linii jest największa na krańcach w systemie wybieranych jest 200 centralnych linii obrazowych (skrajne linie nie są odbierane). Konwersja geometrii z sektora na ekran (scan-converter) oraz uwzględnienie nierównomierności rozkładu przestrzennego linii jest realizowane w oprogramowaniu.

# 4.7 Oprogramowanie sterujące i przetwarzające

Oprogramowanie systemu mikrosonografu dla komputera PC zostało zaimplementowane w systemie operacyjnym Microsoft *Windows XP*. Oprogramowanie składa się z następujących komponentów (rys. 4.17):

- **Oprogramowanie USB (cyusb.sys i cyapi.dll)** dostarczane przez producenta układu kontrolera USB [40, 39]. Sterownik *cyusb.sys* stanowi najniższa warstwę oprogramowania pracującą na poziomie jądra systemu operacyjnego. Biblioteka *cyapi.dll* dostarcza interfejs aplikacyjny w warstwie użytkownika do sterownika *cyusb.sys*.
- **Moduł Python (pyfx2.dll)** zapewnia dostęp do komunikacji USB z modułem koderadigitizera z poziomu języka skryptowego *Python*.
- **Skrypty testowe Python** pozwalają na szybkie i wygodne testowanie komunikacji i funkcji systemu bez konieczności kompilacji aplikacji.



Rysunek 4.16: Kąt pomiędzy kolejnymi liniami sektora dla danego numeru linii (sygnału z enkodera)

- **Biblioteka pomocnicza (fx2hlp.dll)** w języku C zawiera zestaw funkcji komunikacji USB, obsługi strumieniowej transmisji danych z modułu oraz cyfrowego przetwarzania sygnałów (kompresji kodów i detekcji obwiedni). Funkcje cyfrowego przetwarzania sygnałów korzystają z biblioteki *Intel IPP*.
- Aplikacja użytkowa (fx2code.exe) główna aplikacja systemu mikrosonografu zaimplementowana w języku C#. Realizuje funkcje sterująco-kontrolne, przetwarzania i wizualizacji. Aplikacja zapewnia graficzny interfejs użytkownika.
- **Biblioteka Intel IPP** wydajna biblioteka numeryczna wykorzystująca rozszerzenia wektorowe procesorów z rodziny x86.
- **Biblioteki DirectX** biblioteki systemowe do obsługi funkcji multimedialnych, w tym biblioteka *Direct3D* do obsługi grafiki 3D.
- **Platforma .NET** środowisko uruchomieniowe CLR (Common Language Runtime) oraz obiektowe biblioteki dostarczające standardowej funkcjonalności dla aplikacji systemu Windows.

#### 4.7.1 Architektura strumieniowa

Pierwszym założeniem systemu było przetwarzanie i wizualizacja w czasie rzeczywistym. Zapewnienie tego warunku wymaga zapewnienia ciągłości całego procesu: od transmisji cyfrowych danych w.cz. przez przetwarzanie po wizualizację. Tego typu technika przesyłania i przetwarzania jest określana mianem strumieniowej. Należy zwrócić uwagę, że system operacyjny Windows nie jest systemem czasu rzeczywistego i nie gwarantuje czasów realizacji określonych operacji (np. odpowiedzi na przerwanie). Dlatego oprogramowanie musi zapewniać pewną elastyczność i odporność na chwilowe wydłużenia czasów realizacji niektórych operacji.

Jak już powiedziano modelowy algorytm kompresji kodów został zweryfikowany pod względem wydajności. Jednak całość toru cyfrowej obróbki ultrasonografu wymaga dodatkowych operacji — m.in. detekcji obwiedni, scan-convertera. Autor zaproponował strumieniową zbalansowaną architekturę przetwarzania wykorzystującą dostępne zasoby obliczeniowe



Rysunek 4.17: Architektura oprogramowania PC

komputera PC, czyli procesor główny (CPU) i procesor graficzny (GPU). Zadania obliczeniowe zostały podzielone pomiędzy te dwa procesory z uwzględnieniem ich specyfiki 4.18. Algorytm kompresji kodów oraz detekcji obwiedni jest realizowany na procesorze CPU, natomiast scan-converter oraz dodatkowe funkcje post-processingu na GPU. Taka architektura pozwala na realizację znacznie bardziej wymagających systemów przetwarzania bez konieczności stosowania specjalizowanych (i drogich) rozwiązań wieloprocesorowych.

W systemie mikrosonografu podział zadań obliczeniowych, daje duży zapas mocy obliczeniowej, która może być wykorzystana do realizacji nowych funkcji (np. przetwarzania sygnału Dopplera) lub dodatkowych algorytmów przetwarzania (np. poprawa jakości obrazu). Wymagania sprzętowe obecnej wersji oprogramowania mikrosonografu spełnia niemal każdy średniej klasy komputer PC. W naszym obecnym zestawie funkcję tę spełnia komputer przenośny.

# 4.7.2 Przetwarzanie cyfrowe CPU

Algorytm kompresji kodów i detekcji obwiedni został zaimplementowany w języku C z pomocą zoptymalizowanych bibliotek *Intel IPP* [138]. Oba algorytmy działają w dziedzinie częstotliwości i wykorzystują szybką transformatę Fouriera (FFT) do przejścia pomiędzy dziedzinami czasu i częstotliwości.

### 4.7.2.1 Modelowy algorytm przetwarzania

Zaimplementowano i przetestowano modelowy algorytm kompresji kodów (rys. 4.19) i detekcji obwiedni (rys. 4.20). Kompresja kodów jest realizowana jako korelacja w dziedzinie częstotliwości przez mnożenie widm sygnału wejściowego i sygnału wzorca (kodu). Zastosowany algorytm detekcji obwiedni polega na utworzeniu sygnału analitycznego, a następnie obliczeniu modułu jego wartości zespolonej [74].

W trakcie testów funkcjonowania algorytmu kompresji kodów okazało się, że ze względu na efekty brzegowe konieczne jest podwojenie długości sygnałów poddawanych FFT. W przypadku korelacji liczonej w ograniczonym oknie czasowym początkowe próbki sygnału korelacji



Przetwarzanie softwarowe sygnału w.cz.

Rysunek 4.18: Przetwarzanie softwarowe sygnału w.cz.



Rysunek 4.19: Algorytm kompresji kodów Golaya w dziedzinie częstotliwości



Rysunek 4.20: Algorytm detekcji obwiedni

powstają przez przemnożenie i dodanie niewielkiego fragmentu sygnału i wzorca. Dla sygnału o długości N oraz sygnału wzorca o długości n i N < n początkowe i końcowe n próbek obliczonej korelacji są nieprawdziwe i powinny być odrzucone. Ponieważ algorytm FFT wymaga sygnałów o długości będących potęgą dwójki, wejściowa długość sygnału w.cz. 2048 próbek musiała zostać podwojona do 4096 próbek. Początkowe i końcowe 1024 próbki podwojonej długości sygnału zostały wypełnione zerami. Skrajne próbki sygnału po wyjściu z algorytmu kompresji kodów były odrzucane pozostawiając poprawny sygnał o oryginalnej długości wejściowej (2048). Takie parametry długości sygnałów zapewniają poprawne wyniki dla kodów (sygnałów wzorca) o długości do 1024 próbek, co odpowiada możliwościom sprzętowym (wielkości pamięci) układu arbitralnego generatora kodów. W praktyce stosowane dotychczas długości kodów nie przekraczały 256 próbek.

### 4.7.2.2 Zoptymalizowany algorytm przetwarzania

Modelowy (oryginalny) algorytm wykonuje dwukrotne przejście z dziedziny czasu do częstotliwości i z powrotem. Połączenie algorytmu kompresji i detekcji obwiedni umożliwiło realizację następujących po sobie operacji w dziedzinie częstotliwości eliminując zbędne operacje FFT (rys. 4.21).

Wydajność zoptymalizowanego algorytmu wzrosła, w stosunku do algorytmu modelowego, od ok. 20% dla pojedynczych kodów do ok. 40% dla kodów Golaya. Uzyskany wzrost prędkości był liczony dla całego toru przetwarzania i wyświetlania.



Rysunek 4.21: Zmodyfikowany algorytm kompresji kodów Golaya i detekcji obwiedni w dziedzinie częstotliwości

### 4.7.2.3 Detekcja obwiedni

Utworzenie sygnału wideo linii obrazowej wymaga zastosowania detektora obwiedni na sygnale w.cz. po demodulacji (dla nadawania klasycznego) oraz kompresji czasowej kodów (dla sygnałów kodowanych).

W cyfrowym przetwarzaniu sygnałów obwiednię uzyskuje się jako moduł sygnału analitycznego. Sygnał analityczny można utworzyć dla sygnału rzeczywistego w sposób przedstawiony na rys. 4.22 [157], gdzie składowe *I* i *Q* są nazywane odpowiednio kwadraturową i synfazową.



Rysunek 4.22: Tworzenie sygnału analitycznego dla sygnału rzeczywistego

Transformata Hilberta może być zdefiniowana jako filtr o następującej charakterystyce:

$$H(j\omega) = -j sgn(\omega) = \begin{cases} -j, & \omega > 0\\ 0, & \omega = 0, \\ j, & \omega < 0 \end{cases}$$
(4.1)

czyli przesuwnik fazowy o  $\pm \pi/2$ . Cyfrowa implementacja tego filtru może być realizowana za pomocą filtrów o skończonej odpowiedzi impulsowej lub metodą DFT/FFT. W systemie mikrosonografu postanowiono zastosować metodę DFT/FFT, która jest znacznie dokładniejsza od metody filtrów [74].

Dla sygnału analitycznego postaci:

$$x(t) = I(t) + jQ(t)$$

jego widmo możemy zapisać jako:

$$X(f) = \mathscr{F}[x(t)] = \mathscr{F}[I(t) + jQ(t)] = \mathscr{F}[I(t)] + sgn(f)\mathscr{F}[I(t)] = \begin{cases} 0, & f < 0\\ \mathscr{F}[I(t)], & f = 0 \\ 2\mathscr{F}[I(t)], & f > 0 \end{cases}$$
(4.2)

W ten sposób można uzyskać sygnał analityczny za pomocą DTF/FFT z oryginalnego sygnału rzeczywistego. Ponieważ algorytm kompresji kodów także działa w dziedzinie częstotliwości możliwe stało się wytworzenie cyfrowego sygnału analitycznego bez dodatkowych operacji FFT (patrz 4.7.2.2).

#### 4.7.3 Przetwarzanie cyfrowe GPU

Technologia i możliwości obliczeniowe procesorów graficznych zostały przedstawione w podrozdziale 3.1.4. W systemie oprogramowania mikrosonografu procesor GPU został wykorzystany do realizacji przetwarzania obrazów i wizualizacji — w szczególności konwersji geometrii sektora (scan-converter) oraz funkcji post-processingu (paleta kolorów, filtracja obrazowa). Obecne możliwości procesorów GPU oraz zaimplementowana architektura oprogramowania pozwala na implementację dodatkowych algorytmów przetwarzania.

Oprogramowanie funkcji graficznych i przetwarzania jest częścią składową głównej aplikacji i zostało zaimplementowane w języku C# przy wykorzystaniu bibliotek *Direct3D* do obsługi grafiki 3D będących składnikiem zestawu bibliotek obsługi multimediów Microsoft *DirectX 9* [86]. Całość zrealizowanego przetwarzania korzysta zarówno z elementów standardowego potoku przetwarzania grafiki 3D (np. mapowanie tekstur), jak i z programowalnych shaderów do realizacji funkcji specjalnych. Shadery zostały oprogramowane w języku Microsoft HLSL (ang. High Level Shader Language — język shaderów wysokiego poziomu) [56], który jest integralną częścią bibliotek *DirectX* 9.

Na rys. 4.23 pokazano uproszczony schemat przepływu danych w procesorze GPU pod kontrolą bibliotek *DirectX* 9. Obiekty 3D (zwane modelami) w postaci list wierzchołków trafiają do bufora wierzchołków i są przetwarzane przez potok graficzny — czyli programowalny procesor wierzchołków, rasteryzer i programowalny procesor fragmentów. Programowalne procesory, zwane shaderami (wierzchołków i fragmentów), pozwalają na realizację ograniczonej listy operacji na poszczególnych małych elementach danych. Masywna równoległość procesorów GPU objawia się wykonywaniem tych samych operacji na wielu zestawach danych równocześnie.



Rysunek 4.23: Potok przetwarzania i przepływu danych w procesorze GPU (na podstawie [56])

### 4.7.3.1 Konwersja geometrii sektora

Dane obrazowe są zbierane przez głowicę sektorową we współrzędnych biegunowych, a następnie wyświetlane na ekranie rastrowym operującym we współrzędnych kartezjańskich. Dodatkowo, ponieważ dane są zbierane i wyświetlane z innym rastrem transformacja współrzędnych wymaga także zastosowania interpolacji. Rodzaj zastosowanej interpolacji ma duże znaczenie dla jakości uzyskiwanych obrazów, a jednocześnie ma wpływ na wymagania obliczeniowe [155]. Ideę działania scan-convertera przedstawiono na rys. 4.24.

### Metody interpolacji

Najprostsza możliwa metoda interpolacji do najbliższego sąsiada, polegająca na przypisaniu nowemu pikselowi wartości najbliższego sąsiada, daje niezadowalającą jakość obrazu i często wiąże się z pojawianiem charakterystycznego obrazu Moiré (rys. 4.25). Obrazy Moiré powstają wskutek zbyt rzadkiego próbkowania zmiennego przestrzennie sygnału. Metodą lepszą (i uznawaną za standard) jest interpolacja biliniowa, która wylicza wartość piksela na podstawie (bi) liniowej kombinacji wartości czterech najbliższych sąsiadów z wagami uwzględniającymi ich względną odległość od obliczanego punktu.

Kroki wyliczenia wartości piksela P metodą interpolacji biliniowej (oznaczenia wg. rys. 4.26):



Rysunek 4.24: Zasada działania scan-convertera



Rysunek 4.25: Widok sektora z obrazem testowym dla: (po lewej) interpolacji do najbliższego sąsiada, (po prawej) interpolacji biliniowej

1. Wyliczenie wartości pikseli pomocniczych  $R_1$  i  $R_2$  (interpolacja w kierunku osi X):

$$R_{1} = \left(\frac{x_{2} - x}{x_{2} - x_{1}}\right)Q_{11} + \left(\frac{x - x_{1}}{x_{2} - x_{1}}\right)Q_{21},$$
$$R_{2} = \left(\frac{x_{2} - x}{x_{2} - x_{1}}\right)Q_{12} + \left(\frac{x - x_{1}}{x_{2} - x_{1}}\right)Q_{22}.$$

2. Następnie na ich podstawie obliczana jest wartość *P* (interpolacja w kierunku osi *Y*):

$$P = \left(\frac{y_2 - y}{y_2 - y_1}\right) R_1 + \left(\frac{y - y_1}{y_2 - y_1}\right) R_2.$$

Jak widać algorytm interpolacji biliniowej jest bardziej złożony obliczeniowo i wymaga większej liczby dostępów do pamięci. Należy pamiętać, że operacje interpolacji muszą być wykonywane dla każdego punktu obrazu z częstotliwością odświeżania obrazu.



Rysunek 4.26: Geometria i oznaczenia do interpolacji biliniowej

#### Implementacja scan-convertera

Systemy scan-converterów są najczęściej realizowane w postaci osobnych podsystemów w oparciu o programowalne układy cyfrowe FPGA [33]. W systemie mikrosonografu funkcja scan-convertera została zrealizowana na procesorze GPU przy pomocy funkcji mapowania tek-stury (podobnie do metody zastosowanej w [97]). Mapowanie tekstur to jeden z prymitywów grafiki 3D polegający na nakładaniu płaskiego obrazu na obiekt 3D (np. ścianę figury). Obecnie funkcja ta jest realizowana w potoku graficznym 3D przez procesor GPU. Programista wiąże współrzędne wierzchołków modelu (trójkątów, wielokątów) 3D z unormowanymi współrzędnymi tekstury. Funkcja mapowania tekstury interpoluje wartości współrzędnych tekstury z wierzchołków do pikseli wypełniających dany element graficzny [76, 83].

W ultrasonografie linie sygnału w.cz. są zbierane zgodnie z impulsami otrzymywanymi z enkodera głowicy, czyli co zmienny krok kątowy (rys. 4.16). Następnie dla każdego punktu obrazu sektora na ekranie należy pobrać odpowiedni zinterpolowany punkt z bufora zawierającego skompresowane czasowo linie. Znalezienie odpowiadających sobie punktów wymaga przeliczenia kartezjańskich współrzędnych ekranowych na współrzędne biegunowe, a następnie współrzędnych biegunowych na położenie próbki w buforze (adres pamięci). Zastosowanie mapowania tekstury wymaga jedynie jednokrotnego (dla ustalonej geometrii) obliczenia kształtu sektora, który będzie modelem (kształtem geometrycznym) na którym będzie "rozpinana" tekstura. Tekstura składa się z linii sygnału wideo. Współrzędne tekstury każdej linii są związane z obliczoną współrzędną wierzchołka paska sektora odpowiadającego tej linii (rys. 4.24). Kształt geometryczny sektora (model) jest obliczany na podstawie geometrii głowicy (kąt sektora) oraz aktualnie ustawionych parametrów akwizycji sygnału — tj. długości linii obrazowej i głębokości obrazowania (opóźnienia wstępnego). Zmiana któregokolwiek z tych parametrów powoduje zmianę kształtu sektora. System próbkowania tekstury korzysta z wbudowanych w system graficzny funkcji interpolacji, które mogą być łatwo przełączane. Włączenie interpolacji biliniowej nie powoduje zauważalnej zmiany prędkości wyświetlania obrazu.

Obraz sektora jest wyświetlany w osobnym oknie graficznym kontrolowanym przez interfejs *Direct3D*. Wielkość okna może być dowolnie zmieniana przez użytkownika. Domyślnie system wyświetla obraz w proporcji 1:1, ale dostępny suwak umożliwia zmianę proporcji. Zmiana proporcji obrazu może być przydatna przy oglądaniu struktur głęboko położonych dla których kształt sektora staje się bardzo wąski i długi. Dodatkowo okno graficzne jest wyposażone w kursory umożliwiające pomiar odległości w obrazie.

Zastosowane rozwiązanie wyświetlania sektora posiada następujące zalety:

- uniwersalny i bardzo szybki system scan-convertera możliwość korekcji geometrii głowicy oraz modyfikacji kształtu sektora,
- wbudowana w system graficzny interpolacja biliniowa dająca bardzo dobrą jakość obrazu,
- możliwość skalowania obrazu i zmiany proporcji wyświetlania,
- możliwość rozbudowy o dodatkowe funkcji dostępne w systemie graficznym.

### 4.7.3.2 Funkcje pre- i post-processingu

Biblioteki *DirectX 9* umożliwiają wykorzystanie jednostek programowalnych (shaderów) procesora GPU do realizacji funkcji użytkownika. Programy shaderów w języku HLSL mogą realizować przetwarzanie i modyfikację danych graficznych - np. geometrii/współrzędnych modeli, czy wartości/koloru wyświetlanych pikseli.

Elastyczność programowania systemu graficznego oraz shaderów umożliwi realizację zaawansowanych funkcji pre-processingu (przed scan-converterem) i post-processingu. Obecnie oprogramowanie shaderów przeprowadza kompresję logarytmiczną (na etapie preprocessingu) oraz nakładanie palety kolorów (post-processing). Opracowane oprogramowanie pozwala na włączanie nowych programów realizujących np. funkcje filtracji obrazu. Możliwa jest także realizacja wielu następujących po sobie funkcji przetwarzania (np. wielu filtrów) przy pomocy techniki shaderów wieloprzejściowych (ang. multi-pass).

Opracowany system przetwarzania i wyświetlania obrazów w oparciu o standardowy potok graficzny 3D i przetwarzanie GPU z łatwością spełnia wszystkie obecne wymagania i funkcje dla wizualizacji w ultrasonografii. Rozwiązanie to charakteryzuje się bardzo dużą wydajnością i jednocześnie nie obciąża procesora głównego komputera.
### 4.7.3.3 Wyświetlanie i reprodukcja odcieni

Zagadnienia związane z wyświetlaniem i reprodukcją odcieni szarości na ekranie monitora są szczególnie ważne w zastosowaniach medycznych. Od jakości wizualizacji i prezentacji obrazu zależy poprawność jego interpretacji i diagnozy. Do zagadnień tych należą: optymalizacja przekazu informacji obrazowej dla danych warunków prezentacji, dopasowanie prezentacji do możliwości urządzeń obrazujących i percepcji oka ludzkiego oraz powtarzalności reprodukcji obrazu na różnych urządzeniach i w różnych warunkach prezentacji.

Na potrzeby dystrybucji i prezentacji medycznej informacji obrazowej z różnych modalności został opracowany przez NEMA (National Electrical Manufacturers Assocation) standard DICOM (Digital Imaging and Communications in Medicine) [91]. DICOM określa zarówno cyfrowe formaty danych, jak i protokoły komunikacyjne służące wymianie danych. Standaryzacją został także objęty proces wyświetlania obrazu — tj. prezentacji skali szarości urządzeń obrazujących i zależność pomiędzy cyfrowymi wartościami obrazu, a poziomami luminancji urządzenia wyjściowego [92]. Idea standaryzacji prezentacji skali szarości polega na ustaleniu zależności pomiędzy cyfrową wartością sygnału, a prezentowaną na wyświetlaczu luminancja. Standaryzacja opiera się na pomiarach oraz modelu ludzkiej percepcji jasności.

Standard DICOM nie był stosowany w opracowanym systemie *per se*, natomiast odniesiono do niego zastosowany tor przetwarzania jasności w systemie wizualizacji. Dynamika sygnału obrazowego w ultrasonografii osiąga zakres 60–80 dB dlatego musi zostać odpowiednio skompresowana i dopasowana do możliwości wyświetlaczy (30–40 dB) oraz systemu ludzkiej percepcji.

### Korekcja gamma

Parametr *gamma* charakteryzuje reprodukcję odcieni w systemach obrazujących i jest związany z nieliniową uzyskiwanej luminancji w zależności od napięcia sterującego. W systemach analogowych źródłem nieliniowości był monitor CRT (ang. Catode Ray Tube — ekran kineskopowy). Obecnie dla zachowania zgodności z systemami wyświetlania monitory LCD symulują analogiczną krzywą odpowiedzi. Zależność luminancji punktu ekranowego od napięcia sterującego opisana jest zależnością:

$$L = A \cdot V^{\gamma} + B$$

gdzie: L — luminancja punktu na ekranie,  $\gamma$  — współczynnik gamma monitora (2–2,5), A — współczynnik wzmocnienia, B — współczynnik przesunięcia.

#### Postrzeganie odcieni

Na początku należy rozróżnić obiektywne fizyczne parametry promieniowania światła od parametrów subiektywnych określonych na podstawie ludzkiej percepcji. Systemy akwizycji i przetwarzania obrazów operują na sygnałach proporcjonalnych do natężenia promieniowania (W/m<sup>2</sup>), czyli strumienia promieniowania na jednostkę powierzchni (irradiacja ograniczona do widma widzialnego nazywana jest natężeniem oświetlenia). Podobnie systemy grafiki komputerowej funkcjonują w przestrzeni "światła liniowego" (proporcjonalnego do irradiacji/natężenia) dzięki czemu mogą wykonywać operacje mieszania kolorów przez kombinacje liniowe.

Z kolei subiektywny parametr będący podstawą ludzkiej percepcji, jasność (ang. lightness), jest nieliniową funkcją natężenia światła. Fenomenologiczne prawo Webera-Fechnera określa relację pomiędzy fizyczną miarą bodźca a reakcją układu biologicznego/nerwowego. Dotyczy ono reakcji na bodźce takich zmysłów jak wzrok, słuch czy odczuwanie temperatury. Wartość reakcji układu biologicznego jest proporcjonalna do logarytmu bodźca:

$$w = k * \ln(B/B0)$$

gdzie: w — reakcja układu nerwowego (percepcja wrażenia zmysłowego), k — eksperymentalna stała skalująca, B — natężenie danego bodźca, B0 — wartość początkowa bodźca.

Innym eksperymentalnym prawem dotyczącym ludzkiego wzroku jest próg postrzegania różnicy jasności (kontrastu) określony jako 1% zmiany natężenia światła [123]. Rozróżnialność zmian jasności wymusza nieliniowe kodowanie jasności koloru w standardzie RGB24 (24bity/piksel). Liniowe kodowanie jasności każdego koloru w 8-bitach (wartość 0–255) wiąże się z efektem widocznych przejść (pasm) jasności. Dla małych wartości kodu jasności przejścia pomiędzy kolejnymi kodami odpowiadają znacznie większym procentowym różnicom jasności (np. dla kodu 25 różnica wynosi 4%). Z kolei dla kodów powyżej 100 różnica pomiędzy kolejnymi kodami jest mniejsza od 1% i zmniejsza się ze wzrostem numeru kodu, co powoduje nieefektywne wykorzystanie kodów. Z tego powodu obrazy zapisywane w formacie RGB24 są kodowane liniowo w jasności przez zastosowanie nieliniowej funkcji ludzkiej percepcji jasności do wejściowego poziomu natężenia światła.

Funkcję ludzkiej percepcji jasności przybliża się funkcją potęgową o wykładniku ok. 0,4 [123]. W praktyce w systemach komputerowych powszechnie stosowany jest standard sRGB, w którym funkcja percepcji jest określona jako funkcja liniowa dla bardzo małych wartości natężenia i potęgowa dla większych wartości [62, 52].

Generalnie w systemach graficznych komputerów można spotkać dwa systemy toru wyświetlania: z buforem ramki "liniowym w jasności" (rys. 4.27) oraz "liniowym w natężeniu" (rys. 4.28). Standardowo systemy wyświetlania PC pracują "liniowo w jasności" i korzystają z przechowywania i wyświetlania obrazów w formacie RGB24 (wg. standardu sRGB), co zapewnia oszczędność pamięci oraz dobrą reprezentację odcieni za pomocą 256 poziomów jasności. W przypadku przetwarzania grafiki 3D, która wymaga mieszania kolorów (ang. blending) stosowany jest tryb pracy z buforem ramki "liniowym w natężeniu" (rys. 4.28). W tym trybie operacje mieszania kolorów są liniowe, ale wymaga to stosowania buforów ramki o większej precyzji (co najmniej 10-bitów/kolor) w celu zapewnienia dobrej reprezentacji odcieni. Dodatkowo na wyjściu liniowym w natężeniu musi być zastosowana korekcja gamma. Biblioteka *Direct3D* udostępnia funkcje regulacji krzywej gamma (*SetGammaRamp*) oraz automatycznej konwersji pomiędzy obrazami zapisanymi w standardzie sRGB i liniowymi w natężeniu.



Rysunek 4.27: Tor wyświetlania z buforem ramki "liniowym w jasności"

Aplikacja wizualizacji mikrosonografu działa w trybie graficznym 3D, czyli z buforem ramki "liniowym w natężeniu". Wejściowy bufor graficzny tekstury używany do obróbki i wyświetlania obrazów pracuje w zmiennopozycyjnym formacie 16-bitowym, który zapewnia pokrycie pełnego zakresu wymaganej dynamiki. Dodatkowe korekty nieliniowości (poza gammą) mogą być realizowane na etapie post-processingu, gdzie obecnie nakładana jest paleta kolorów. Sys-



Rysunek 4.28: Tor wyświetlania z buforem ramki "liniowym w natężeniu"

tem ma zdefiniowane palety odcieni szarości oraz kolorowe. Wzorce palet są zapisane w plikach i mogą być łatwo modyfikowane i rozszerzane o nowe palety.

### 4.7.4 Oprogramowanie użytkowe

Aplikacja użytkowa systemu mikrosonografu spełnia funkcje sterująco-kontrolne, przetwarzania i wizualizacji. Aplikacja została zaimplementowana w języku C# na platformie *Microsoft* .*Net* i przy wykorzystaniu bibliotek *Direct3D*. Interfejs użytkownika jest zbudowany przy pomocy *Windows Forms* będących elementem platformy *Microsoft* .*Net* [118, 119]. Część funkcjonalności związanej z obsługą komunikacji USB oraz przetwarzania sygnałów jest zawarta w bibliotece *fx2hlp.dll* (rys. 4.17). Biblioteka *fx2hlp.dll* została zaimplementowana w języku C ponieważ korzysta wewnętrznie z biblioteki obsługi USB (*cyapi.dll*) oraz biblioteki numerycznej *Intel IPP*, które udostępniają interfejsy dla tego języka.

W celu zapewnienia komunikacji, przetwarzania i wyświetlania w czasie rzeczywistym przy zapewnieniu odporności na chwilowe wahania prędkości transmisji i czasu wykonywania operacji zastosowano podział aplikacji na watki wykonywania programu oraz mechanizm buforowania. Główny watek aplikacji realizuje funkcje obsługi interfejsu użytkownika, przetwarzania i wyświetlania. Funkcje obsługi komunikacji strumieniowej przez USB są wykonywane w bibliotece *fx2hlp.dll* w osobnym watku. Watek komunikacji USB korzysta z asynchronicznych (nieblokujących) funkcji wej./wyj. do obsługi komunikacji i buforowania danych. Funkcje asynchroniczne pracują w trybie overlapped [131], który zapewnia optymalne wykorzystanie zasobów systemu operacyjnego. Mechanizm overlapped polega na zaalokowaniu zestawu wielu buforów pamieci i przekazaniu ich do warstwy jadra. Sterownik urządzenia (USB) realizujący odbiór danych korzysta bezpośrednio z przekazanych buforów i wypełnia je nadchodzącymi danymi. Zapełnienie kolejnego bufora jest sygnalizowane aplikacji za pomocą jednego z mechanizmów komunikacji międzyprocesowej Win32 [131]. Aplikacja przejmuje kontrolę nad wypełnionym buforem — np. realizuje niezbędne operację przetwarzania, a następnie przekazuje go z powrotem do warstwy jądra. Dzięki zastosowaniu wielu buforów operacje odbioru danych i ich przetwarzania moga być realizowane równolegle, co znaczaco zwieksza wydajność.

Pojedyncze, odebrane przez USB, linie sygnału w.cz. są następnie poddawane przetwarzaniu i przekazywane do aplikacji. Aplikacja tworzy bufor danych jednego obrazu, który jako tekstura jest przekazywany do systemu wyświetlania sektora. Subsystem wyświetlania realizuje funkcję scan-convertera przez mapowanie przekazanej tekstury na zadany kształt sektora. Opcjonalnie mogą być realizowane dodatkowe operacje pre- i post-processingu.

Na rys. 4.29 pokazano wygląd głównego okna kontrolnego aplikacji, a poniżej opisano jego podstawowe funkcje użytkowe:

A — menu z funkcjami zapamiętywania surowych sygnałów w.cz. oraz przetworzonych obrazów.



Rysunek 4.29: Widok głównego okna kontrolnego aplikacji mikrosonografu: A-L opis w tekście

- B pasek narzędziowy z dostępem do najczęściej wykorzystywanych funkcji: uruchamianie akwizycji, zapamiętywanie obrazów. Uruchamianie tych funkcji jest także możliwe z klawiatury za pomocą klawiszy funkcyjnych.
- C wybór palet kolorów obrazu. Dostępne są palety odcieni szarości w skali liniowej i logarytmicznej oraz palety kolorowe (np. termiczna, sepia, hsv). System palet opiera się na plikach, dzięki czemu nowe palety mogą być dodawane do systemu bez modyfikacji aplikacji.
- D wybór kodu nadawczego. System wspiera arbitralne przebiegi kodowane, które są wczytywane z dysku z plików tekstowych. Wzorce kodów, po ich wybraniu, są ładowane do modułu kodera-digitizera oraz służą do przeprowadzania kompresji czasowej. Dzięki tekstowemu formatowi plików, nowe kody mogą być łatwo projektowane i tworzone w zewnętrznych programach obliczeniowych (np. Matlab, Mathcad) i dodawane do systemu przez proste umieszczenie pliku w odpowiednim katalogu.
- E wybór funkcji post-processingu. Dodatkowe funkcje post-processingu są realizowane przez specjalizowane programy shaderów procesora GPU. Kontrolka umożliwia wybieranie i ładowanie dostępnych programów. Programy shaderów są ładowane z tzw. pliku efektów, co umożliwia ich modyfikację bez rekompilacji głównej aplikacji.
- F cyfrowa regulacja dynamiki sygnału. Kompresja czasowa powoduje cyfrowe wzmocnienie sygnału, który musi być następnie przeskalowany do zakresu wartości jasności pikseli. Kontrolka umożliwia arbitralne skalowanie lub włączenie funkcji automatycznego skalowania na podstawie wartości maksymalnej sygnału.
- G regulacja głębokości obrazowania służy do ustalania wstępnego opóźnienia akwizycji sygnału, a tym samym określenia głębokości z jakiej zbierany jest obraz. Zmiana głębokości powoduje zmianę kształtu sektora, który jest automatycznie przeliczany.
- H zmiana skali obrazu pozwala na zmianę domyślnej proporcji 1:1 obrazu. Funkcja może być przydatna w przypadku obrazowania głęboko położonych obszarów (kiedy kształt sektora staje się bardzo długi i wąski) lub do zwiększenia wizualnej rozdzielczości w jednej osi.
- I regulacja poziomu ZRW. Określa początkowy poziom tłumienia z którego startuje ZRW. System umożliwia arbitralne programowanie krzywej ZRW, jednak obecnie jest ona generowana jako funkcja "liniowa w dB" o zadanym nachylaniu i punkcie początkowym.
- J regulacja głębokości ZRW. Określa głębokość na jakiej ma zacząć działać ZRW.
- **K** regulacja wzmocnienia analogowego odbiornika.
- L dodatkowe parametry dla niestandardowych ustawień. Parametry te są obecnie używane jedynie w celach uruchomieniowo-testowych. W wersji aplikacji dla lekarzy te kontrolki są zablokowane.

### 4.8 Podsumowanie

Zaprojektowany i zrealizowany system poza spełnieniem pierwotnych założeń osiągnął także dodatkowe cele:

- uniwersalność modułu kodera-digitizera szerokie możliwości innych zastosowań w akwizycji sygnałów w.cz. w różnych dziedzinach nauki i techniki,
- małe rozmiary i niski koszt modułu,
- niski pobór prądu możliwość zasilania bezpośrednio z portu USB komputera,
- opracowana strumieniowa architektura przetwarzania softwarowego pozwalająca na realizację innych systemów przetwarzania i wizualizacji w czasie rzeczywistym,
- *know-how* pozwalający na realizację kolejnych systemów wykorzystujących najnowsze układy i systemy elektroniczne.

O uniwersalności opracowanego modułu oraz oprogramowania mogą świadczyć trzy nowe zastosowania jakie system do dnia dzisiejszego znalazł w laboratorium Zakładu Ultradźwięków IPPT (rozdział 6). Analizę możliwości rozbudowy obecnego systemu oraz potencjalne możliwości innych zastosowań opracowanych technologii przedstawiono w rozdziale 6.

# **Rozdział** 5

# Wyniki

Zaprojektowany i wykonany system mikrosonografu został poddany badaniom i weryfikacji poprawności działania, w szczególności: generacji sygnałów kodowanych, akwizycji ech, komunikacji pomiędzy modułem i komputerem PC oraz algorytmów cyfrowego przetwarzania sygnałów. Ponadto określono jakość uzyskanego przetwarzania A/C mierząc dynamiczne parametry przetwornika dla sygnałów sinusoidalnych.

Kompletny i przetestowany system został użyty do przeprowadzenia wstępnych badań eksperymentalnych *in vivo* w laboratorium. Obecnie trwają pierwsze badania kliniczne z wykorzystaniem aparatu przedstawione w końcowej części rozdziału.

### 5.1 Testy modułu

#### 5.1.1 Komunikacja moduł ↔ komputer PC

Przepustowość transmisji danych z modułu do komputera ma podstawowe znaczenie dla funkcjonowania całego systemu w czasie rzeczywistym.

W pierwszym etapie zaprojektowano prosty generator danych testowych dla układu FPGA. Dane generowane w FPGA były przekazywane do kontrolera interfejsu USB, a następnie transmitowane do PC i tam weryfikowane. Całość obsługi testów komunikacji i weryfikacji danych po stronie PC została zaimplementowana w formie skryptów w języku *Python*.

Ponieważ moduł zaprojektowano do strumieniowej transmisji danych zawiera on tylko bufor w FPGA na jedną linię akwizycji (podwójną dla kodów Golaya). Dane linii muszą zwolnić bufor FPGA przed kolejną akwizycją, czyli muszą zostać przesłane do układu kontrolera USB. Układ USB zawiera 4 bufory po 512 bajtów każdy, które są wykorzystywane do obsługi komunikacji. Obecne korzystamy z linii w.cz. o długości 2048 próbek, co daje 4096 bajtów danych (dwa bajty na próbkę). Liczba danych ulega podwojeniu dla kodów Golaya. Widać z tego, że całkowita pojemność buforów w module (FPGA + układ USB) wynosi 1,5 linii sygnału.

Sprawdzono dwa tryby transmisji danych:

- 1. Generator wytwarza dane testowe, które są przekazywane w miarę możliwości do układu kontrolera USB. W przypadku zajętości buforów USB układ generatora czeka na ich zwolnienie. W ten sposób symulowany jest nieskończenie duży bufor danych po stronie układu FPGA, gdyż nie następuje tutaj przepełnienie bufora FPGA w przypadku opóźnień związanych z transmisją USB.
- 2. Drugi schemat odpowiada normalnemu trybowi pracy, w którym dane z generatora (docelowo z przetwornika A/C) wypełniają bufor linii w układzie FPGA z prędkością próbko-

wania. Dane z bufora FPGA są przekazywane do układu USB w miarę możliwości (wolnych buforów USB). Niewystarczająca prędkość transmisji danych przez USB powoduje błąd przepełnienia bufora FPGA, który nie zdąża być opróżniony przed kolejną akwizycją.

Na komputerze notebook *ACER TravelMate 4650* (procesor *Intel Pentium M* z zegarem 1,7 GHz, 2 MB pamięci podręcznej drugiego poziomu, 512 MB pamięci operacyjnej RAM) uzyskano przepustowość transmisji USB: do 40 MB/s dla trybu 1 oraz do 30 MB/s dla trybu 2, oba przy zużyciu czasu procesora na poziomie poniżej 30%. W trybie 2 zaobserwowano do 5% błędów przepełnienia bufora. Oznacza to, że uśredniona prędkość transmisji USB może osiągać pułap 30–40 MB/s, jednak występują drobne "zacięcia" transmisji, czyli zachwiania prędkości odbioru danych przez PC. Ustalono, że "zacięcia" transmisji USB występują na poziomie sterowników/jądra. System operacyjny Windows nie gwarantuje limitu czasu obsługi zdarzeń i przerwań od urządzeń wej./wyj., dlatego jedynym rozwiązaniem jest zapewnienie odpowiednio dużych buforów.

Występowanie błędów przepełnień pojedynczych linii powoduje zgubienie obrazu oraz konieczność resynchronizacji akwizycji kolejnego obrazu z pozycją krańcową ruchu głowicy. Ponieważ w module kodera-digitizera nie przewidziano większego bufora danych konieczne było ograniczenie prędkości zbierania obrazów do ok. 8 obrazów/s, co jest ciągle wystarczającą prędkością do obrazowania struktur nieruchomych.

Alternatywnym rozwiązaniem mogłoby być numerowanie przesyłanych linii i algorytm wypełniania obrazu za pomocą otrzymanych kompletnych linii. Niekompletne lub opuszczone linie obrazu byłyby wypełniane treścią np. z poprzedzającej linii lub przez interpolację miedzyliniową.

### 5.1.2 Parametry systemu akwizycji

Zdając sobie sprawę z podstawowego znaczenia parametrów przetwarzania A/C dla jakości obrazowania przeprowadzono pomiary przetwornika A/C przy pobudzeniu sygnałem zmiennym.

Na podstawie metodologii testowania przetworników A/C [29, 77, 78, 80] opracowano stanowisko testowe oraz zestaw skryptów do określania parametrów przetwarzania. Skrypty, uruchamiane z linii poleceń, realizowały akwizycję wektorów sygnału o długości 1024–8192 próbek z częstotliwością 200 MHz, a następnie ich przetwarzanie. Zastosowano technikę pomiaru parametrów dynamicznych przetworników A/C metodą FFT (patrz podrozdział 3.2.3). Ponieważ sygnał wejściowy nie był synchronizowany z zegarem próbkowania (tzw. próbkowanie niekoherentne) konieczne było okienkowanie — stosowano okno Hanninga. Następnie, na podstawie obliczonego FFT, skrypt obliczał parametry: SNR, SINAD, ENOB, SFDR. Do obliczeń ENOB przetwornika A/C metodą FFT zastosowano parametry (tabela 5.1) zalecane w oprogramowaniu *ADC Analyzer* firmy *Analog Devices* [10]. Zniekształcenia harmoniczne brały pod uwagę pierwszych 6 harmonicznych częstotliwości podstawowej.

|                                              | 1. 1 .1.4        |
|----------------------------------------------|------------------|
| Tabela 5.1: Parametry FFT do obliczeń ENOB j | przetwornika A/C |

| Parametr                                    | liczba prążków FFT |
|---------------------------------------------|--------------------|
| Upływ spektralny częstotliwości podstawowej | 25                 |
| Upływ spektralny harmonicznych              | 3                  |
| Upływ spektralny dla sygnału DC             | 6                  |

Źródłem sinusoidalnego sygnału testowego był generator *Hewlett-Packard 8643A*, który przez pasywny filtr dolnoprzepustowy na 50 MHz był podłączony do wejścia modułu. Poziom napięcia wyjścia z generatora ustalono na +6 dBm dla obciążenia 50  $\Omega$ , co zapewniało pełne wysterowanie przetwornika.

Jako jeden parametr do porównań wybrano najbardziej reprezentatywną efektywną liczbę bitów ENOB, która określa liczbę bitów idealnego przetwornika o dynamice odpowiadającej dynamice badanego przetwornika. Parametr ENOB mierzy się dla określonej częstotliwości próbkowania oraz poziomu wejściowego sygnału sinusoidalnego. ENOB uwzględnia wszelkie źródła zakłóceń i szumów występujące w układzie przetwornika A/C.

Katalogowe dane dla wykorzystywanego układu przetwornika A/C Maxim MAX1215 [81] podają jako typową wartość SINAD 65 dB, co odpowiada ENOB = 10,5 bitów. Dla pierwotnej wersji płytki FX2 z programowalnym układem generatora zegara *Cypress* CY22393 [41] dla czę-stotliwości wejściowej 30 MHz uzyskano ENOB 8,2 bitów; dla drugiej wersji z układem generatora kwarcowego *Epson* EG-2121 [44] ENOB wynosił 10,2 bitów. Uzyskany w realnym układzie poziom dynamiki przetwornika A/C, przy zastosowaniu generatora kwarcowego, jest bardzo zbliżony do danych katalogowych.

W celu zbadania wpływu zegara na uzyskaną dynamikę przetwarzania A/C zmierzono jitter zegara za pomocą wysokiej klasy oscyloskopu z analizą jittera *Agilent DSA91304A* o paśmie 13 GHz i częstotliwości próbkowania 40 GS/s. Dla układu zegara *Cypress* CY22393 zmierzono wartość RMS jittera 14 ps, a dla generatora kwarcowego *Epson* EG-2121 3 ps. W podrozdziale 3.2.3.3 pokazano związek wielkości jittera zegara z wartością SNR przetwarzania A/C dla określonej częstotliwości wejściowej. Obliczając SNR przetwornika A/C dla zmierzonych wartości jittera zegara próbkującego można zauważyć, że to właśnie jitter zegara determinuje uzyskane wartości efektywnej liczby bitów przetwornika. Wielkość jittera 14 ps zegara *Cypress* dla częstotliwości wejściowej 30 MHz ogranicza teoretycznie SNR do 51,6 dB (ENOB = 8,3 bitów), co jest w zgodzie z pomiarem ENOB 8,2 bitów. Jakość generatora *Epson* EG-2121 jest wystarczająca żeby zapewnić katalogowe parametry przetwornika A/C — jitter 3 ps zapewnia teoretyczny SNR 65 dB (ENOB = 10,5 bitów). Zmierzona wartość ENOB 10,2 bitów jest nieco niższa od wartości katalogowej, na co wpływ mają zapewne inne źródła zakłóceń i zniekształceń sygnału wejściowego.

Otrzymane wyniki pomiarów parametrów przetwarzania A/C są zbliżone do danych katalogowych, co wskazuje na poprawność konstrukcji systemu elektronicznego. Jitter zegara próbkującego ma decydujący wpływ na jakość przetwarzania i w wielu praktycznych zastosowaniach próbkowania sygnałów w.cz. ogranicza możliwą do uzyskania efektywną liczbę bitów przetwornika A/C.

### 5.1.3 Weryfikacja w pętli elektrycznej

Weryfikacja systemu (modułu i oprogramowania przetwarzania) w pętli elektrycznej polegała na podłączeniu wyjścia kodera do wejścia układu akwizycji. W ten sposób sygnały nadawcze trafiały bezpośrednio do odbiornika — gdzie były digitalizowane i następnie przetwarzane. Taki test miał sprawdzić poprawność działania układu kodera-digitizera, transmisji oraz softwarowej realizacji kompresji czasowej kodów. Jak widać na rys. 5.1 przebiegi w pętli elektrycznej są zgodne z teoretycznymi.



Rysunek 5.1: Weryfikacja systemu w pętli elektrycznej dla 16-bitowych kodów Golay na 20 MHz: a) sygnał nadawczy kod A, b) sygnał nadawczy kod B, c) skompresowany odebrany kod A, d) skompresowany odebrany kod B, e) suma skompresowanych kodów A i B, f) obwiednia sumy skompresowanych kodów A i B

### 5.1.4 Sygnały od reflektora w wodzie

Kolejny test, tym razem kompletnego systemu mikrosonografu (moduł kodera-digitizera wraz z analogowymi układami wej./wyj.), został przeprowadzony metodą echa od reflektora. Głowica z wyłączonym silnikiem (unieruchomiona) została umieszczona w statywie nad płaskim reflektorem zanurzonym w wodzie. Na rys. 5.2 są pokazane przebiegi dla pobudzeń krótkim impulsem (1 okres sinusoidy 20 MHz), a na rys. 5.3 dla sygnałów kodowanych (16-bitowy kod Golaya 20 MHz). W odróżnieniu od przypadku idealnego (pętli elektrycznej), w tym przypadku mamy ograniczone pasmo przez głowicę oraz wzmacniacze analogowe. Pomimo tego uzyskujemy poprawną kompresję czasową impulsu (rys. 5.3f). Widoczne jest nieznaczne zniekształcenie uzyskanego impulsu (rys. 5.3e oraz f), które wynika z dodatkowych drgań przetwornika (tzw. ogona).



Rysunek 5.2: Eksperymentalne sygnały ech od reflektora w wodzie: a) sygnał nadawczy 1 okres sinusoidy na 20 MHz, b) obwiednia sygnału echa, c) widmo mocy sygnału nadawczego, d) widmo mocy odebranego echa

### 5.1.5 Geometria systemu obrazującego

Geometria obrazowania systemu została zweryfikowana na wzorcu nitkowym. Wzorzec był wykonany z żyłki nylonowej o średnicy 0,2 mm rozciągniętej pomiędzy dwiema blaszkami z rastrem kwadratowym 1 mm. Pomiary odległości pomiędzy nitkami na obrazie uwzględniające rzeczywisty rozmiar piksela wykazały rozbieżności nie większe niż 0,1 mm.

Geometria sektora na ekranie powstaje w procesie scan-convertera na podstawie parametrów mechanicznych głowicy. Dokładność wykonania i pomiaru mechaniki głowicy decydują o dokładności geometrycznej obrazowania. Należy mieć na uwadze, że zastosowana głowica jest zmodyfikowaną standardową głowicą do obrazowania w zakresie częstotliwości 3,5 – 7 MHz, gdzie rozdzielczość podłużna i poprzeczna są wielokrotnie mniejsze.



Rysunek 5.3: Eksperymentalne sygnały ech od reflektora w wodzie: a) sygnał nadawczy 16-bitowy kod Golaya 20 MHz (jeden z pary), b) odebrany sygnał echa od reflektora, c) widmo mocy sygnału nadawczego, d) widmo mocy odebranego echa, e) skompresowany sygnał echa, f) obwiednia skompresowanego sygnału echa

### 5.1.6 Testy oprogramowania przetwarzania i wizualizacji

Pierwsze testy wydajności kompletnego oprogramowania przeprowadzono na komputerze typu notebook *ACER TravelMate 4650* o konfiguracji: procesor *Intel Pentium M* z zegarem 1,7 GHz, 2 MB pamięci podręcznej drugiego poziomu, 512 MB pamięci operacyjnej RAM, procesor graficzny *Nvidia GeForce Go 6600* z 64 MB pamięci wideo. Testy przeprowadzono dla modelowego algorytmu przetwarzania oraz algorytmu zoptymalizowanego. Przy pracy z głowicą z prędkością 7 obrazów/s zanotowano 54% obciążenie procesora dla algorytmu modelowego oraz 37% dla algorytmu zoptymalizowanego. Ekstrapolując czasy przetwarzania poszczególnych algorytmów ustalono, że system w tej konfiguracji może pracować z prędkością do 25 obrazów/s.

### 5.1.6.1 Wydajność toru przetwarzania i wyświetlania

W celu ustalenia maksymalnej możliwej prędkości przetwarzania i wyświetlania przeprowadzono kolejne testy na wydajniejszym komputerze stacjonarnym bez synchronizacji z ruchem mechanicznym głowicy oraz ograniczeń transmisji cyfrowej z modułu. Przyjęto parametry sygnału w.cz. takie same jak dla obrazowania z głowicą tj. 200 linii/obraz oraz 2048 próbek/linię.

Dla komputera PC z procesorem *Intel Core2 Duo E6550* z zegarem 2,33 GHz, wyposażonego w dwa rdzenie, 4 MB pamięci podręcznej i 2 GB pamięci RAM oraz kartę graficzną *Nvidia GeForce 8500* uzyskano wyniki przedstawione w tabeli 5.2.

| Transmisja | Algorytm | Algorytm        | Wzrost         |
|------------|----------|-----------------|----------------|
|            | modelowy | zoptymalizowany | wydajności (%) |
| Pojedyncza | 65       | 86              | +32            |
| Podwójna   | 43       | 60              | +40            |

Tabela 5.2: Prędkość przetwarzania i wyświetlania (liczba obrazów/s)

Na podstawie tych danych można stwierdzić, że zaimplementowane oprogramowanie pozwala na przetwarzanie i wyświetlanie w czasie rzeczywistym w szerokim zakresie prędkości. Widoczna jest znacząco wyższa wydajność algorytmu zoptymalizowanego — dla podwójnej transmisji (kodów Golaya) niemal 50%.

### 5.1.6.2 Wydajność scan-convertera

Mając na uwadze inne możliwe zastosowania samego algorytmu scan-convertera zmierzono jego wydajność. Dla obrazu o rozmiarze 550 na 550 pikseli i dla wejściowych danych obrazowych w formacie 200 linii po 1024 próbki na wydajnym komputerze PC wyposażonym w kartę graficzną *Nvidia GeForce 8600GT* uzyskano prędkość przetwarzania powyżej 700 obrazów/s! Standardowe monitory mają częstotliwość odświeżania obrazu w zakresie 50–100 Hz i proces wyświetlania obrazów przez kartę graficzną jest z nią wewnętrznie zsynchronizowany. Pomiary przeprowadzono przy włączonej specjalnej opcji karty powodującej odświeżanie pamięci obrazu bez czekania na synchronizację sygnału monitora.

Uzyskana prędkość działania przekracza wszystkie opisane w literaturze sprzętowe systemy scan-converterów do obrazowania ultradźwiękowego [33]. Opracowany scan-converter jest rozwiązaniem znacząco tańszym, szybszym i bardziej uniwersalnym od dedykowanych systemów sprzętowych. Tak duża prędkość wyświetlania predysponuje ten system do obrazowania pracy serca małych zwierząt — np. myszy dla których wymagane jest obrazowanie z prędkością 150–300 obrazów/s.

### 5.2 Porównanie kodów

W ramach testów systemu oraz badań transmisji kodowanej przeprowadzono pomiary rozdzielczości podłużnej oraz zysku kompresji dla kodów fazowych (Barkera i Golaya) i porównano je z pobudzeniem krótkim impulsem. Ponadto przeprowadzono jakościowe badania porównawcze *in vivo* dla pobudzeń kodowanych.

### 5.2.1 Rozdzielczość podłużna i stosunek sygnał-szum

Badania ilościowe rozdzielczości oraz zysku stosunku sygnał-szum dla transmisji kodowanej przeprowadzono na pojedynczych liniach sygnału w.cz. ech od reflektora. Głowica była umieszczona w statywie nad reflektorem z brązu i wyposażona w jeden z pierwszych prototypowych przetworników thick-film o stosunkowo wąskim paśmie (ok. 40%). System ultrasonografu pracował w trybie obrazowym (prezentacja B). Z zapisanych sygnałów ech w.cz. dla obrazu była wybierana pojedyncza linia w.cz. dla której zanotowano maksymalną amplitudę ech. Przygotowane skrypty określały w sposób automatyczny rozdzielczość FWHM (ang. Full Width at Half Maximum — szerokość impulsu w połowie wysokości) i stosunek sygnał-szum.

Pomiary wykonano w ośrodku bez tłumienia (woda) oraz ośrodku tłumiącym — z warstwą żelu grubości 1 cm wykonanego z mieszaniny agaru, gliceryny i wody o tłumieniu ok. 0,3 dB/MHz/cm . W tabeli 5.3 i na wykresach 5.4 i 5.5 przedstawiono otrzymane wyniki dla częstotliwości 20 MHz. Widoczny jest wzrost (rys. 5.4) stosunku sygnał-szum dla kodów Golaya o rosnącej długości, przy czym jest on nieco niższy dla ośrodka tłumiącego niż dla wody. Rozdzielczość (rys. 5.5) mierzona w połowie wysokości impulsu (FWHM) jest dla kodów Golaya wyższa niż dla pobudzenia krótkim impulsem i tym razem nieco niższa w ośrodku tłumiącym niż w wodzie. Gorsze wyniki w ośrodku tłumiącym są spowodowane zniekształceniem widma ech wynikającym z tłumienia, a tym samym gorszą korelacją ech odbiorczych ze wzorcem.

| Pobudzenie    | Woda     |           | Ośrodek tłumiący |           |
|---------------|----------|-----------|------------------|-----------|
|               | SNR [dB] | FWHM [µm] | SNR [dB]         | FWHM [µm] |
| Sinus 1-okres | 42,9     | 37,5      | 38,6             | 37,5      |
| Golay 8-bit   | 45,5     | 22,5      | 44,2             | 37,5      |
| Golay 16-bit  | 50,4     | 22,5      | 48,0             | 30,0      |
| Golay 32-bit  | 53,6     | 22,5      | 52,6             | 30,0      |
| Barker 13-bit | 46,7     | 30,0      | 44,9             | 30,0      |

Tabela 5.3: Porównanie rozdzielczości i stosunku sygnał-szum dla kodów fazowych przy częstotliwości 20 MHz w wodzie i ośrodku tłumiącym

### 5.2.2 Badania in vivo

Przeprowadzono także badania jakościowe *in vivo* porównując subiektywnie jakość uzyskanego obrazowania. Na rys. 5.6 przedstawiono obrazy przekroju podłużnego naczynia w dłoni uzyskane przy pobudzeniu krótkim impulsem oraz 16-bitowym kodem Golaya przy częstotliwości



Rysunek 5.4: Porównanie stosunku sygnał-szum dla kodów fazowych przy częstotliwości 20 MHz w wodzie i ośrodku tłumiącym (agar)



Rysunek 5.5: Porównanie rozdzielczości dla kodów fazowych przy częstotliwości 20 MHz w wodzie i ośrodku tłumiącym (agar)

20 MHz i 35 MHz<sup>1</sup>. Zastosowanie kodu Golaya pozwala uzyskać lepszy kontrast, mniejsze szumy oraz lepiej widoczne głębiej położone struktury. Ponadto możliwe stało się obrazowanie z niemal dwukrotnie wyższą częstotliwością ultradźwięków (z 20 MHz na 35 MHz), czyli większą rozdzielczością i rozróżnialnością szczegółów.



Sinus 2 okresy 20 MHz, SNR = 30 dB

Golay 16-bit 20 MHz, SNR = 38 dB



Golay 16-bit 35 MHz, SNR = 32 dB



Rysunek 5.6: Obrazy w prezentacji B — przekrój podłużny naczynia w nadgarstku; rozmiar pionowy obrazu 7,6 mm, proporcje obrazu 1:1

<sup>&</sup>lt;sup>1</sup>Nie przedstawiono obrazu dla pobudzenia krótkim impulsem dla 35 MHz ze względu na jego niską jakość.

### 5.2.2.1 Porównanie z mikrosonografem z 1998

W drugiej połowie lat 1990 w ZU IPPT został opracowany pierwszy ultrasonograf wysokiej częstotliwości. Był to aparat analogowo-cyfrowy, z analogowym demodulatorem i cyfrową akwizycją sygnału wideo. Układ przetwarzania A/C pracował z częstotliwością 32 MHz i rozdzielczością 8 bitów. System tworzył obraz z 200 linii, każda linia sygnału składała się z 256 próbek. Stosowane były przetworniki ultradźwiękowe z PZT oraz niobianu litu na częstotliwość 32 MHz pobudzane krótkimi impulsami (1–2 okresów). Oprogramowanie w środowisku *Windows* realizowało scan-converter i wyświetlanie obrazu.

Na rys. 5.7 zaczerpniętym z pracy Szymańskiej *et al.* [13] z 2000 r. pokazano obraz ultrasonograficzny skóry z tego aparatu. Jakość obrazu pozostawia wiele do życzenia. Widoczna jest stosunkowo niska rozdzielczość podłużna, słaba dynamika obrazu oraz duża wielkość pikseli spowodowana zastosowaniem najprostszej interpolacji do najbliższego sąsiada. Porównując obrazy uzyskiwane z nowo opracowanego aparatu (rys. 5.6) można stwierdzić postęp jaki dokonał się w jakości obrazowania.





### 5.3 Zastosowania kliniczne

Opracowany ultrasonograf wysokiej częstotliwości z transmisją kodowaną został już zastosowany do przeprowadzenia pierwszych badań klinicznych. Aplikacje w badaniach dermatologicznych oraz naczyniowych opisano poniżej.

Planowane są także kolejne zastosowania badawcze przy współudziale zainteresowanych jednostek:

- Szpital MSWiA badanie zmian skórnych, w szczególności łuszczycy (łac. psoriasis).
- Instytut Onkologii badanie i rozpoznawanie nowotworów skóry, w szczególności czerniaka złośliwego (łac. melanoma malignum).

### 5.3.1 Badania cellulitu

Badania dotyczą oceny skuteczności działania produktu kosmetycznego i suplementacji doustnej na skórę objętą cellulitem. Projekt jest prowadzony przez dr K. Mloska z Zakładu Diagnostyki Obrazowej Akademii Medycznej w Warszawie oraz pod patronatem Polskiego Towarzystwa Ultrasonograficznego.

W badaniu bierze udział 90 kobiet podzielonych na cztery grupy (3 grupy badane po ok. 25-30 osób i 1 grupa placebo 15 osób) z zakwalifikowanym 2–3 stopniem cellulitu (co odpowiada zblednięciu skóry po ucisku i wystąpienie tzw. "skórki pomarańczowej" przy dotyku lub w spoczynku [156]). Całkowity czas badania wyniesie 12 tygodni i obejmie po 3 spotkania z każdą pacjentką.

Dla badanego obszaru (okolica udowo-pośladkowa) są określane następujące parametry:

- 1. Echogeniczność skóry.
- 2. Grubość skóry (wraz z tkanką podskórną).
- 3. USG skóry (skóra właściwa i naskórek).
- 4. Elastografia (elastyczność poszczególnych warstw skóry i tkanki podskórnej).

Parametry 1–3 są określane za pomocą opracowanego ultrasonografu wraz z dodatkowym oprogramowaniem, parametr 4 ultrasonografem komercyjnym z funkcją elastografii.

Dotychczasowe wyniki badań wskazują na dużą użyteczność i wysoką jakość uzyskiwanego obrazu z opracowanego aparatu (rys. 5.8). Wstępne wyniki pomiarów wykazały dużą korelację pomiędzy stanem skóry a zmierzoną echogenicznością, co pozwala mieć nadzieję na opracowanie metody oceny tej dolegliwości.

### 5.3.2 Pomiary grubości kompleksu intima-media

Ultrasonograficzna ocena struktury ściany naczyń krwionośnych pozwala na wykrywanie zaburzeń morfologii i funkcji układu sercowo-naczyniowego, dzięki czemu umożliwia wczesne wykrywanie dysfunkcji układu krążenia także u chorych bezobjawowych. Obecnie poszukuje się wskaźników, które ułatwią selekcję chorych lub osób o podwyższonym ryzyku schorzeń. Jednym z takich wskaźników jest grubość kompleksu śródbłonek–błona środkowa naczynia tzw. IMT (ang. intima-media thickness) będąca cennym indykatorem ryzyka wystąpienia incydentu sercowo-naczyniowego [69].

Pomiary IMT wykonywane standardowymi aparatami ultrasonograficznymi przeprowadza się na tętnicy szyjnej, m.in. ze względu na ograniczoną rozdzielczość podłużną dostępną w tym zakresie częstotliwości [122]. Dr R. Olszewski z Wojskowego Instytutu Medycznego zaproponował pomiar IMT w naczyniach palców (paliczkach). Wysoka rozdzielczość opracowanego aparatu pozwala na pomiar naczyń krwionośnych o małych średnicach występujących w palcach. Badanie paliczków charakteryzuje się łatwym dostępem oraz dodatkowo umożliwia przeprowadzenie badań wysiłkowych i reakcji czynnościowych (np. na lokalną zmianę temperatury), które są niemożliwe do wywołania na tętnicy szyjnej.

Wstępne rezultaty przeprowadzonych w laboratorium ZU badań (rys. 5.9) są obiecujące i planuje się ich kontynuację w warunkach klinicznych.







Rysunek 5.8: Cellulit 4 stopień. Przed kuracją (górny) — czerwone strzałki pokazują wrastanie tkanki podskórnej w skórę, zielona strzałka pokazuje niewielki obrzęk. Po kuracji (dolny) — brak wrastania tkanki podskórnej w skórę właściwą, nie widać obrzęku



Rysunek 5.9: Przekrój podłużny naczynia w dłoni. Średnica naczynia w środkowej części ok. 1,1 mm, widoczna przy krawędzi naczynia warstwa intima-media wynosi ok. 0,13 mm

# **Rozdział 6**

# Podsumowanie

Główny cel pracy jakim była praktyczna realizacja techniki transmisji kodowanej w ultrasonografii w czasie rzeczywistym został osiągnięty (rys. 6.1). Opracowana od podstaw uniwersalna elektroniczna platforma akwizycji i cyfrowego przetwarzania sygnałów umożliwiła implementację techniki kodowanej w szerokim zakresie częstotliwości ultradźwiękowych.

Ultrasonograf został już zastosowany przez lekarzy do opracowania i badań nowych metod diagnostycznych, co według autora jest największym osiągnięciem projektu. Możliwość ewaluacji metody transmisji kodowanej przez lekarzy oraz implementacji nowych metod obrazowych na uniwersalnej platformie ultrasonografu stanowi wyznacznik wartości tego kilkuletniego projektu.

Projekt systemu został poprzedzony dogłębną analizą wymagań, dostępnych rozwiązań układów elektronicznych oraz środków cyfrowego przetwarzania sygnałów. Przeanalizowano zakres zastosowań obrazowania ultradźwiękowego wysokiej częstotliwości, jego ograniczenia i możliwości ich przezwyciężenia za pomocą transmisji kodowanej (rozdział 1). Następnie przedstawiono metodę transmisji kodowanej i specyfikę związaną z jej zastosowaniem w technice ultradźwiękowej (rozdział 2). Przed przystąpieniem do projektowania systemu dokonano przeglądu dostępnych obecnie systemów cyfrowego przetwarzania sygnałów oraz zagadnień związanych z przetwarzaniem A/C (rozdział 3). Następnie określono założenia projektowe, proponowaną architekturę systemu, a w końcu sam projekt systemu (rozdział 4). Opracowany i zbudowany mikrosonograf został następnie poddany weryfikacji funkcjonalnej oraz testom wydajności (rozdział 5), które potwierdziły poprawność jego działania. Zaprezentowano także pierwsze badania kliniczne, w których wykorzystano zbudowany aparat. W końcowej podsumowującej części pracy przedstawiono inne aplikacje systemu, możliwości jego dalszej rozbudowy i komercjalizacji, a także potencjalne zastosowania opracowanych technologii.

### 6.1 Systemy elektroniczne

Opracowane systemy elektroniczne i rozwiązania sprzętowe powstały w oparciu o najnowocześniejsze układy i technologie elektroniczne. Dzięki temu, oraz dzięki przemyślanej architekturze systemu, zrealizowany moduł elektroniczny kodera-digitizera wykracza swoją funkcjonalnością poza pierwotnie przyjęte założenia. Wysoka programowalność systemu pozwoli na jego rozbudowę o dodatkowe funkcje, a także nowe zastosowania (opisane w dalszej części rozdziału) bez zmian sprzętowych w samym module. Ponadto *know-how* zdobyty podczas realizacji tego urządzenia pozwoli na budowę kolejnych bardziej złożonych systemów akwizycji, w tym systemów wielokanałowych, które są kolejnym celem badawczym naszego zespołu.



Rysunek 6.1: Widok kompletnego systemu mikrosonografu

Zastosowanie w projekcie nowoczesnych programowalnych układów cyfrowych FPGA, pozwoliło na miniaturyzację modułu kodera-digitizera, minimalizację poboru prądu oraz, co najważniejsze, dało możliwość programowej zmiany funkcjonalności modułu z komputera sterującego. Programowalność modułu umożliwia zmianę w trakcie pracy zarówno parametrów pracy systemu, a także samego algorytmu nadawania i akwizycji. Daje to unikalną możliwość zmiany rodzaju nadawanych kodów w trakcie badania — od krótkich impulsów, przez pojedyncze sygnały kodowane do kodów wymagających podwójnej transmisji. Zastosowanie wysokiej jakości cyfrowego generatora arbitralnego pozwala na generację dowolnego kształtu sygnałów nadawczych, co zapewnia możliwość badań najszerszej możliwej klasy sygnałów kodowanych.

Modułowa budowa systemu elektronicznego z wydzielonym uniwersalnym modułem kodera-digitizera oraz analogowymi modułami wej./wyj. daje łatwą możliwość adaptacji systemu do różnych częstotliwości ultradźwiękowych, a także do akwizycji innego rodzaju sygnałów w.cz.. Zakres częstotliwości przetwarzania A/C modułu wynosi 20–200 MHz, co pokrywa większość praktycznych zastosowań ultradźwięków w medycynie i technice.

Zastosowany interfejs komunikacyjny USB 2.0 pomiędzy modułem a komputerem PC zapewnia dużą prędkość przesyłania cyfrowych danych (do 40 MB/s) i możliwości bezpośredniego zasilania modułu z komputera. Niski pobór prądu modułu oraz specjalne tryby uśpienia pozwalają na budowę rozwiązań mobilnych i zasilanych bateryjnie w oparciu o komputery przenośne.

Małe rozmiary i pobór prądu zrealizowanego modułu oraz niski koszt produkcji poszerza zakres jego zastosowań i pozwala myśleć o komercjalizacji rozwiązań na nim opartych.

### 6.2 Systemy przetwarzania

Drugą równie ważną częścią opracowanego systemu ultrasonografu jest podsystem cyfrowej obróbki sygnału. Zapewnienie kompresji czasowej ech w czasie rzeczywistym było podstawowym wymogiem stawianym praktycznemu systemowi implementującemu transmisję kodowaną. Cel ten został osiągnięty przez zastosowanie hybrydowej architektury przetwarzania wykorzystującej moc obliczeniową jednostki centralnej (procesora CPU) oraz procesora graficznego GPU. Wydaje się, że tego typu hybrydowa architektura przetwarzania będzie obowiązująca w najbliższych latach.

Wydajność opracowanych algorytmów wielokrotnie przekroczyła założone minima, możliwą do uzyskania prędkość transferu surowych danych w.cz. do komputera, a nawet prędkość pracy dostępnej głowicy ultradźwiękowej. Daje to szansę na ich dalsze zastosowanie w systemach wymagających znacznie większej prędkości obrazowania np. obrazowaniu małych zwierząt.

Duże możliwości aplikacyjne stoją także przed oprogramowaniem przetwarzania zaimplementowanym na procesorze GPU. Zrealizowane środowisko programowe pozwala na implementację dodatkowych procedur przetwarzania sygnałów i obrazów (np. filtrów obrazowych). Sam algorytm scan-convertera zaimplementowany przez autora na procesorze GPU osiągnął prędkość przetwarzania przewyższającą wszystkie znane z literatury rozwiązana sprzętowe. Metody przetwarzania na GPU będą dalej rozwijane w naszym laboratorium, gdyż posiadają ogromny potencjał obliczeniowy.

## 6.3 Rozbudowa i inne aplikacje systemu

O możliwościach rozbudowy oraz innych aplikacjach opracowanego systemu decyduje jego charakterystyka:

- Wysoki stopień programowalności modułu kodera-digitizera układ FPGA, który może być reprogramowany w trakcie pracy z komputera.
- Wysoka prędkość strumieniowej transmisji danych surowych z modułu do komputera.
- Bardzo duża wydajność cyfrowego przetwarzania sygnałów i wizualizacji danych.

Przedstawione możliwości nie są czysto teoretyczne o czym świadczą trzy nowe aplikacje systemu zrealizowane do dnia dzisiejszego w Zakładzie Ultradźwięków:

- 1. Eksperymentalny system do obserwacji rozchodzenia się fal poprzecznych w tkance za pomocą sondowania wiązką fal podłużnych z prędkością 1000–10000 linii/sek. Akwizycja sygnałów w.cz. linii z taką prędkością powtarzania nie jest możliwa za pomocą standardowych oscyloskopów cyfrowych. Specjalizowane karty digitizerów, które pozwalają na tego typu akwizycję są bardzo kosztowne. Zastosowanie modułu z odpowiednio zmodyfikowanym oprogramowaniem pozwoliło na realizację tych unikatowych badań.
- 2. System akwizycji sygnału w.cz. z beamformera analogowego w zakresie częstotliwości 5–10 MHz do badań metod syntetycznej apertury. Akwizycja danych z wielu kanałów odbywa się w sposób sekwencyjny przez programowanie wybranych kanałów beamformera i rejestrację ech z pojedynczego wybranego przetwornika. Moduł kodera-digitizera i beamformera został oprogramowany tutaj za pomocą skryptów *Python* dzięki czemu możliwa jest łatwa modyfikacja schematu nadawania i akwizycji.
- 3. Skanujący system obrazowania kości w zakresie częstotliwości 0,5–2 MHz. System ten będzie służył do badań osteoporozy oraz nowych metod obrazowania parametrycznego bazujących na przetwarzaniu surowego sygnału ech w.cz.. Budowa tego urządzenia jest analogiczna do pierwotnego mikroultrasonografu. Modyfikacji uległy układy analogowe oraz nieznacznie oprogramowanie sterujące.

### 6.3.1 Rozbudowa systemu

Podstawowym przeznaczeniem zrealizowanego systemu ultrasonograficznego jest badanie i ewaluacja metod transmisji kodowanej. Jednak jego duże możliwości modyfikacji zarówno procesu nadawania i akwizycji sygnałów, jak i ich przetwarzania cyfrowego pozwalają myśleć o tym systemie jako o uniwersalnej platformie do wdrażania nowych metod obrazowych. Najistotniejszą cechą platformy, która otwiera drogę do implementacji nowych metod obrazowych jest dostęp do surowych danych w.cz. ech.

Poniżej przedstawiono przegląd interesujących technik i algorytmów przetwarzania, które z technicznego punku widzenia mogą zostać zaimplementowane na zbudowanej platformie mikrosonografu rozszerzając lub modyfikując jego obecną funkcjonalność.

Adaptacyjna transmisja kodowana. W obecnym systemie istnieje możliwość zmiany typu nadawanego kodu w trakcie pracy, ale wybrany jeden typ kodu jest używany do tworzenia całego obrazu. Adaptacja polegałaby na zmianie sposobu nadawania (typu lub długości kodu) w zależności od pewnych parametrów (np. charakterystyki sygnału, głębokości, etc.). Przykładowo: zastosowanie długich kodów daje duży zysk stosunku sygnał-szum potrzebny do obrazowania głębiej położonych struktur, ale jednocześnie powoduje powstanie dużej strefy martwej, która uniemożliwia obrazowanie blisko głowicy. Z drugiej strony mała odległość od głowicy jest związana z niewielkim tłumieniem sygnału, więc zastosowanie wzmacniającego działania kodów jest niepotrzebne. Zastosowanie kodów o dwóch długościach: krótkiego do obrazowania blisko głowicy i długiego do głębiej położonych struktur pozwoli pogodzić ze sobą te sprzeczne wymagania. Oczywiście nadawanie w dwóch strefach wymaga dwukrotnego nadawania kodów, więc nieco ogranicza prędkość zbierania obrazów. Implementacja tego sposobu nadawania jest możliwa dzięki sprzętowemu sterowaniu procesu nadawania i akwizycji sygnałów opartej na programowalnym układzie FPGA.

Innym przykładem jest adaptacja filtracji dopasowanej po stronie odbiorczej uwzględniająca modyfikację widma ech spowodowaną tłumieniem. Zastosowanie estymatora przesunięcia częstotliwości środkowej ech z głębokością i zastosowanie go do strojenia filtra dopasowanego jest możliwe dzięki dużej mocy obliczeniowej systemu.

- Automatyczna kontrola wzmocnienia i optymalizacja obrazu. Automatyczna optymalizacja obrazu oraz nastaw ultrasonografu są obecnie oferowane w wysokiej klasy aparatach. Dostępna duża moc przetwarzania cyfrowego opracowanego systemu (procesor CPU+GPU) pozwala na realizację algorytmów analizy sygnału w.cz. ech w czasie rzeczywistym. Przykładem optymalizacji nastaw jest automatyczna kontrola ZRW (Zasięgowej Regulacji Wzmocnienia) [124, 90]. Na podstawie analizy sygnału ech można oszacować energię sygnału oraz obliczyć wymagane wzmocnienie dla danej głębokości dla każdej linii obrazu niezależnie. Wyliczone krzywe korekcji ZRW są przesyłane do układu FPGA, który dynamicznie steruje regulacją wzmocnienia w trakcie odbioru.
- **Obrazowanie harmoniczne** polega na nadawaniu na częstotliwości podstawowej, a odbieraniu i obrazowaniu sygnału na częstotliwości harmonicznej. W celu separacji sygnału harmonicznego od podstawowego stosuje się dwie lub więcej sekwencje nadawcze (kody), a następnie przeprowadza się sumowanie lub odejmowanie odebranych od nich sygnałów ech [105]. System w obecnej postaci nadaje się do implementacji tego typu obrazowania.

- **Obrazowanie parametryczne** polega na obrazowaniu innych parametrów tkanki, jak np.: tłumienia, elastyczności (elastografia), ruchu (ang. tissue Doppler). Większość tych alternatywnych technik operuje na surowym sygnale w.cz. ech, który jest dostępny w mikrosonografie. Dostępna duża moc przetwarzania pozwala na realizację nawet bardzo złożonych obliczeniowo algorytmów (np. elastografii). Ponadto programowalny układ FPGA zapewnia wsparcie sprzętowe niezbędne do niektórych technik wymagających zewnętrznej synchronizacji lub sterowania.
- **Automatyczna biometria.** Pomiary biometryczne mogą być łatwo zaimplementowane w postaci dodatkowych aplikacji użytkowych systemu. Pomiary dzielimy na statyczne tj. realizowane na zamrożonym obrazie lub dynamiczne realizowane w trakcie procesu wyświetlania. W zakresie wysokich częstotliwości pomiary mogą dotyczyć rozmiarów struktur narządów np. oka [154], parametrów zmian chorobowych (np. wielkość, objętości guza) oraz naczyń krwionośnych (grubość, kompleks intima-media).
- **Filtracja obrazu i redukcja ziarna.** Stworzone oprogramowanie przetwarzania i wizualizacji wykorzystuje procesor graficzny GPU do realizacji scan-convertera oraz umożliwia implementację własnych filtrów obrazowych. Filtry mogą służyć do poprawy jakości obrazu, redukcji ziarna (speckle), segmentacji, rozpoznawania granic struktur, itp. Poza możliwościami operacji na pojedynczych liniach obrazowych oraz całym obrazie, dzięki dostępności dużej ilości pamięci karty graficznej istnienie także możliwość wykonywania operacji na wielu obrazach np.:
  - filtrów działających na kilku kolejnych obrazach (np. uśrednianie z wagą),
  - sklejanie obrazów (np. z wielu sektorów, różnych głębokości),
  - nakładanie obrazów lub ich fragmentów (np. obrazu parametrycznego na prezentację B),

Przykładem zaawansowanej funkcji, która może być zrealizowana na platformie mikrosonografu jest redukcja ziarna metodą składania częstotliwości (ang. frequency compounding). Metoda ta polega na akwizycji obrazów w prezentacji B dla dwóch (lub wielu) różnych częstotliwości nadawczych, a następnie na uśrednieniu tych obrazów. Rozkład ziarna w obrazie jest funkcją częstotliwości, więc w procesie uśredniania echa od nieruchomych struktur dodają się konstruktywnie, natomiast ziarno zostaje wygładzone.

### 6.3.2 Inne aplikacje

Poniżej przedstawiono potencjalne nowe zastosowania opracowanego systemu lub jego elementów.

- **Ultrasonografia standardowej częstotliwości z transmisją kodowaną.** Pomimo, że mikrosonograf został opracowany na zakres wysokich częstotliwości ultradźwięków może być łatwo zaadoptowany do częstotliwości niższych. Modyfikacji wymagają jedynie analogowe układy wzmacniaczy wejściowych i wyjściowych, sam moduł kodera-digitizera nie wymaga żadnych modyfikacji.
- **Ultrasonografia wewnątrznaczyniowa** IVUS (ang. Intravascular Ultrasound) jest techniką obrazową, w której miniaturowy obrotowy przetwornik ultradźwiękowy wprowadza się bezpośrednio do naczynia krwionośnego. Ze względu na małe rozmiary obiektu stosuje

się typowo wysokie częstotliwości — powyżej 20 MHz. Zrealizowany mikrosonograf może być użyty do tego zastosowania niemal od razu. Wymagane modyfikacje dotyczą jedynie interfejsu elektrycznego do głowicy obrotowej oraz geometrii obrazu.

- **Ultrasonografia małych zwierząt.** Ze względu na ograniczoną przepustowość interfejsu USB obrazowanie małych zwierząt, które wymaga bardzo wysokich prędkości akwizycji obrazu nie jest do zrealizowania przy użyciu obecnego modułu kodera-digitizera. Jednak samo oprogramowanie przetwarzania jest wystarczająco wydajne do tego celu. Algorytm kompresji ech na wydajnym komputerze PC może pracować z prędkością do ok. 100 Hz. Sama funkcja wizualizacji ze scan-converterem może pracować z prędkością ponad 500 Hz.
- **Defektoskopia.** Moduł i oprogramowanie w obecnej postaci nadają się do bezpośredniej realizacji defektoskopu z transmisją kodowaną. Modyfikacje sprzętowe dotyczą jedynie części analogowej w celu dopasowania jej do stosowanego zakresu częstotliwości i parametrów głowic. Zmiany w oprogramowaniu obejmują funkcjonalność wizualizacji przebiegów.
- **Akwizycja sygnałów w.cz.** Moduł i oprogramowanie w obecnej postaci nadają się do realizacji tej funkcji. Specyficzne wymogi dotyczące kondycjonowania sygnału analogowego oraz obróbki danych cyfrowych będą wymagały drobnych zmian w części analogowej oraz oprogramowaniu.

### 6.3.3 Perspektywy rozwoju ultrasonografii wysokiej częstotliwości

W dalszej perspektywie rozwój ultrasonografii wysokiej częstotliwości jest związany z zastosowaniem przetworników wieloelementowych — dotychczas zarezerwowanych jedynie dla aplikacji w zakresie niższych częstotliwości. Pojawia się coraz więcej prac dotyczących konstrukcji i technologii wytwarzania wysoko częstotliwościowych przetworników liniowych i pierścieniowych [134, 30, 132]. Duże nadzieje są też związane z zastosowaniem technologii mikroelektronicznej do produkcji urządzeń elektro-mechanicznych tzw. MEMS (ang. Micro Electro-Mechanical Systems) [114, 6].

Obecnie stosowane głowice sektorowe z jednoelementowym przetwornikiem mają ograniczoną strefę dobrego obrazowania wokół ogniska przetwornika. W tej sytuacji główna zaleta transmisji kodowanej, czyli zysk stosunku sygnał-szum dla głębiej położonych struktur nie może być optymalnie wykorzystany. Zastosowanie przetwornika pierścieniowego z ogniskowaniem elektronicznym pozwoli na zwiększenie strefy ostrego obrazowania. Obecnie w ZU IPPT rozpoczęto prace mające na celu zastosowanie 7-elementowego przetwornika w głowicy sektorowej. Potrzebny do tego zadania nowy wielokanałowy system nadawania i akwizycji powstaje jako rozwinięcie przedstawionego w tej pracy rozwiązania.

### 6.4 Możliwości komercjalizacji ultrasonografu

W ostatnim rozdziale pracy przedstawiono porównanie opracowanego systemu z produktami dostępnymi na rynku oraz możliwe ścieżki jego komercjalizacji.

Opracowana platforma ultrasonografu z transmisją kodowaną może pracować zarówno w zakresie częstotliwości standardowych, jak i wysokich. Obecnie, według wiedzy autora, nie są dostępne komercyjne aparaty wysokiej częstotliwości z funkcją transmisji kodowanej (przegląd aparatów przedstawiono w podrozdziale 1.3.2.2). W zakresie standardowych częstotliwości jako punkt do porównań wybrano dostępne od niedawna na rynku zintegrowane głowice USB, które bazują na jednoelementowych przetwornikach ze skanowaniem mechanicznym. Konstrukcja tych zintegrowanych głowic USB jest najbardziej podobna do opracowanego systemu, gdyż wykorzystują one interfejs USB do przesyłania danych cyfrowych z głowicy do komputera oraz wykorzystują softwarową obróbkę i wizualizację. Adaptacja opracowanego mikrosonografu do wersji zintegrowanej głowicy USB wydaje się możliwa i jest ciekawą opcją dla komercjalizacji opracowania.

### 6.4.1 Zintegrowane głowice USB

W ostatnich kilku latach na rynku pojawiły się proste i tanie "głowice USB" — czyli aparaty zintegrowane w całości w głowicy i podłączane do komputera przez interfejs USB. Aparaty te składają się z jednoelementowego poruszanego mechanicznie przetwornika (głowica sektorowa), uproszczonej i zminiaturyzowanej elektroniki oraz komputera PC z oprogramowaniem przetwarzania i wizualizacji. Przykładem tego typu rozwiązania jest opracowanie opisane w 2008 r. przez Richarda i współpracowników [129], które dostępne jest z przetwornikami w zakresie 5– 12,5 MHz i oferuje obrazowanie z prędkością do 10 Hz. Opisywany aparat wykazuje pewne podobieństwa techniczne z rozwiązaniem autora — m.in. ten sam układ interfejsu USB, softwarowa realizacja scan-convertera. Z drugiej strony występują istotne różnice, które przyczyniają się do znacznego uproszczenia konstrukcji i zmniejszenia poboru mocy ale jednocześnie ograniczają to rozwiązanie — m.in.:

- 1. W rozwiązaniu Richarda digitalizowany jest sygnał po analogowym detektorze obwiedni i wzmacniaczu logarytmicznym, co pozwala na zastosowanie 8-bitowego przetwarzania A/C o niskiej częstotliwości próbkowania (30 MHz) ale uniemożliwia dostęp do surowych danych w.cz. ech. Aparat nie wspiera transmisji kodowanej.
- 2. Cyfrowy układ sterowania jest oparty na prostym układzie logicznym, który nie zapewnia tego stopnia programowalności, co układ FPGA zastosowany przez autora.
- 3. Aparat jest wyposażony w prosty układ nadajnika impulsowego, który pozwala jedynie na generację krótkich impulsów.

Zastosowane rozwiązania pozwoliły na ograniczenie mocy elektrycznej urządzenia do ok. 1,25 W (co pozwala na zasilanie bezpośrednio z USB) oraz miniaturyzację płytki drukowanej umieszczonej w głowicy do rozmiaru 23 mm na 86 mm.

Dwa inne komercyjne rozwiązania zintegrowanych "głowic USB" charakteryzujących się podobnymi parametrami i funkcjami, to:

- 1. *NuWav Ultrasound* (http://www.laborie.com) na częstotliwość 3,5–12 MHz.
- 2. Direct Medical Systems (http://www.innovasound.us) na częstotliwość 3,5–5 MHz.

### 6.4.2 Optymalizacja systemu

W poniższym punkcie przedstawiono modyfikacje systemu, które pozwoliłyby na dalsze ograniczenie rozmiarów, kosztów i pobieranej mocy w celu realizacji koncepcji zintegrowanej głowicy USB. Należy zaznaczyć, że opisana poniżej adaptacja mikrosonografu do wersji zintegrowanej wciąż będzie wspierała transmisję kodowaną (choć z ograniczeniem do kodów fazowych) oraz inne zaawansowane funkcje przetwarzania, które nie są dostępne w przedstawionych rozwiązaniach komercyjnych.

### 6.4.2.1 Minimalizacja poboru prądu

Obecnie system mikrosonografu posiada własne zasilanie, ponieważ całkowity pobór prądu przekracza limit dostępny na złączu USB (nominalnie 2,5 W). Sam moduł kodera-digitizera może być zasilany z portu USB — wymaga jedynie ok. 1,75 W. Ograniczenie całkowitego poboru mocy systemu do wielkości 2,5 W wydaje się możliwe przy zastosowaniu następujących modyfikacji:

- Rezygnacja z liniowego wzmacniacza mocy na rzecz układu impulsowego. Wiąże się to z ograniczeniem możliwości nadawania tylko kodów fazowych (Golay, Barker), ale w sposób znaczny redukuje pobór prądu.
- Zastosowanie przetwornika A/C o mniejszym poborze prądu i/lub o niższej częstotliwości próbkowania dobranej do zastosowanej częstotliwości ultradźwięków. Aktualnie stosowany przetwornik A/C pokrywa całe pasmo zastosowań do wysokiej częstotliwości włącznie ale wydziela do 0,5 W mocy. Obecnie na rynku pojawiły się układy bardziej energooszczędne.
- Zastosowanie bardziej zaawansowanego zarządzania energią przez wykorzystanie układów umożliwiających stan uśpienia i oszczędzania energii.

#### 6.4.2.2 Minimalizacja rozmiarów

Zrealizowany system mikrosonografu jest dość kompaktowy (rys. 6.1), ale jego miniaturyzacja do wymaganego rozmiaru dla wersji zintegrowanej nie jest zadaniem łatwym. Zmiany mające na celu miniaturyzację aparatu to:

- Miniaturyzacja układu mechanicznego i silnika napędowego oraz modyfikacja obudowy głowicy w celu zapewnienia miejsca na płytkę elektroniczną.
- Opracowanie nowej płytki elektronicznej aparatu:
  - integracja modułów analogowych i cyfrowych na jednej płytce,
  - miniaturyzacja przez zastosowanie układów w mniejszych obudowach (np. BGA, QFN),
  - zwiększenie gęstości upakowania elementów oraz montaż dwustronny elementów na płytce.

# **DODATEK A**

# Schemat ideowy systemu

### PUSTA STRONA



Rysunek A.1: Schemat ideowy modułu kodera-digitizera — układ interfejsu USB

### PUSTA STRONA



### PUSTA STRONA



Rysunek A.3: Schemat ideowy modułu kodera-digitizera — układ przetwornika A/C

### PUSTA STRONA


Rysunek A.4: Schemat ideowy modułu kodera-digitizera — układ przetwornika C/A

### PUSTA STRONA





### PUSTA STRONA



Rysunek A.6: Schemat ideowy wzmacniacza mocy nadajnika (autor: Bogusław Zienkiewicz)

### PUSTA STRONA



Rysunek A.7: Schemat ideowy wzmacniacza odbiorczego (autor: Ryszard Tymkiewicz)

### **DODATEK B**

# Oryginalne osiągnięcia autora

Poniżej przedstawiono oryginalne osiągnięcia autora związane z realizacją systemu opisanego w tej pracy:

- 1. Opracowanie koncepcji, projektu elektronicznego i wykonanie modułu kodera-digitizera będącego sercem platformy ultrasonografu z transmisją kodowaną.
- 2. Projekt i implementacja oprogramowania całości systemu mikrosonografu sterowania, akwizycji, cyfrowego przetwarzania sygnałów i wizualizacji.
- 3. Opracowanie i implementacja architektury hybrydowego przetwarzania sygnałów na procesorze CPU i GPU.
- 4. Realizacja wydajnego algorytmu kompresji ech oraz scan-convertera dla ultrasonografii kodowanej.
- 5. Modyfikacja opracowanej platformy ultrasonografu do realizacji kolejnych systemów badawczych: system do obrazowania kości, system akwizycji sygnałów z beamformera analogowego, instrumentacja pomiarów rozchodzenia się fal podłużnych.
- 6. Stworzenie oprogramowania systemu "Wanna" do pomiarów pól przetworników ultradźwiękowych.

## Bibliografia

- [1] General purpose computation on graphics hardware. SIGGRAPH 2005 COURSE, 2005.
- [2] OpenMP application program interface. Raport instytutowy, OpenMP Architecture Review Board, 2005.
- [3] Tutorial on GPGPU. SUPERCOMPUTING 2006, 2006.
- [4] J. G. Abbott. Rationale and derivation of MI and TI a review. Ultrasound Med. Biol., 25(3), 1999.
- [5] Agilent Technologies. *Jitter Analysis Techniques for High Data Rates*, 2003. Nota aplikacyjna 1432.
- [6] F. Akasheh, T. Myers, J. D. Fraser, S. Bose, A. Bandyopadhyay. Development of piezoelectric micromachined ultrasonic transducers. *Sensors and Actuators A*, 111(2–3):275–287, 2004.
- [7] H. Alexander, D. L. Miller. Determining skin thickness with pulsed ultrasound. *Journal of Investigative Dermatology*, 72(1):17–19, 1979.
- [8] Analog Devices. A Technical Tutorial on Digital Signal Synthesis, 1999.
- [9] Analog Devices. AD9744, 2005. Karta katalogowa.
- [10] Analog Devices. ADC analyzer user manual, 2006. Dokumentacja techniczna.
- [11] Analog Devices. AD9517, 2007. Karta katalogowa.
- [12] Analog Devices. AD9854, 2007. Karta katalogowa.
- [13] E. Szymańska and A. Nowicki, K. Mlosek, J. Litniewski M. Lewandowski, W. Secomski, R. Tymkiewicz. Skin imaging with high frequency ultrasound — preliminary results. *European Journal of Ultrasound*, 12(1):9–16, 2000.
- [14] ARM. ARM7TDMI (Rev 3) Technical Reference Manual, 2001. Karta katalogowa.
- [15] A. A. Atchley, L. A. Frizzell, R. E. Apfel, C. Holland, S. Madenshetty, R. Roy. Thresholds for cavitation produced in water by pulsed ultrasound. *Ultrasonics*, 26(5), 1988.
- [16] Atmel. AT91SAM7S512, AT91SAM7S256, AT91SAM7S128, AT91SAM7S64, AT91SAM7S321, AT91SAM7S32, AT91SAM7S161, AT91SAM7S16, 2007. Karta katalogowa.
- [17] J. Axelson. USB complete: everything you need to develop custom USB peripherals. Lakeview Research, 2001.

- [18] B. Baker. *A glossary of analog-to-digital specifications and performance characteristics*. Texas Instruments, 2006. Nota aplikacyjna SBAA147.
- [19] D. K. Barton, S. A. Leonov, redaktorzy. *Radar Technology Encyclopedia*. Artech House, 1997.
- [20] L. Bassi, E. Boni, A. Dallai, F. Guidi, S. Ricci, P. Tortoli. ULA-OP: a novel ultrasound advanced open platform for experimental research. 2007 IEEE International Ultrasonics Symposium, New York, USA, 2007.
- [21] V. Behar, D. Adam. Parameter optimization of pulse compression in ultrasound imaging systems with coded excitation. *Ultrasonics*, 42:1101–1109, 2004.
- [22] M. Berson, J. M. Gregoire, F. Gens, J. Rateau, F. Jamet, L. Vaillant, F. Tranquart, L. Pourcelot. High frequency (20 MHz) ultrasonic devices: Advantages and applications. *Eur. J. Ultrasound*, 10(1):53–63, 1999.
- [23] OpenGL Architecture Review Board, redaktor. *OpenGL programming guide: the official guide to learning OpenGL, version 2.* Addison-Wesley, 2005.
- [24] P. B. Borwein, R. A. Ferguson. A complete description of Golay pairs for lengths up to 100. *Mathematics of Computation*, 73:967–985, 2004.
- [25] D. Brandwood. Fourier Transforms in Radar and Signal Processing. Artech House, 2003.
- [26] B. Brannon. *Aperture uncertainty and ADC system performance*. Analog Devices. Nota aplikacyjna AN-501.
- [27] B. Brannon. *Sampled systems and the effects of clock phase noise and jitter*. Analog Devices. Nota aplikacyjna AN-756.
- [28] B. Brannon. *Demystifying Sigma-Delta ADCs*. Maxim Integrated Products, 2003. Nota aplikacyjna AN1870.
- [29] B. Brannon, R. Reeder. *Understanding High Speed ADC Testing and Evaluation*. Analog Devices. Nota aplikacyjna AN-835.
- [30] J. A. Brown, F. S. Foster, A. Needles, E. Cherin, G. R. Lockwood. Fabrication and performance of a 40 MHz linear array based on a 1-3 composite with geometric elevation focusing. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 54(9):1888–1894, 2007.
- [31] I. Buck, T. Foley, D. Horn, J. Sugerman, K. Fatahalian, M. Houston, P. Hanrahan. Brook for GPUs: stream computing on graphics hardware. *ACM Trans. Graph.*, 23(3):777–786, 2004.
- [32] P. Burns. Software defined radio for 3G. Artech House, 2002.
- [33] J. H. Chang, J. T. Yen, K. K. Shung. High-speed digital scan converter for high-frequency ultrasound sector scanners. *Ultrasonics*, 48(5), 2008.
- [34] R. Y. Chiao, X. Hao. Coded excitation for diagnostic ultrasound: a system developer's perspective. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 52(2):160–170, 2005.
- [35] R. S. C. Cobbold. Foundations of Biomedical Ultrasound. Oxford University Press, 2006.

- [36] R. C. Cofer, B. F. Harding. *Rapid system prototyping with FPGA'S: Accelerating the design process.* Newnes, 2006.
- [37] I. Crawford, K. Wadleigh. *Software optimization for high performance computing: creating faster applications.* Prentice Hall, 2000.
- [38] Cray Inc. Cray XD1 datasheet, 2006.
- [39] Cypress Semiconductor. Cypress CyAPI Programmer's Reference, 2003. Dokumentacja.
- [40] Cypress Semiconductor. *Cypress CyUsb.sys Programmer's Reference*, 2003. Dokumentacja.
- [41] Cypress Semiconductor. CY22393, CY22394, CY22395, 2004. Karta katalogowa.
- [42] Cypress Semiconductor. *CY7C68013A*—*EZ-USB FX2LP USB Microcontroller*, 2006. Karta katalogowa.
- [43] Ch. H. Dick, H. M. Pedersen. Design and Implementation of High-Performance FPGA Signal Processing Datapaths for Software Defined Radios. Xilinx and Technical University of Denmark, 2004. Nota aplikacyjna.
- [44] Epson. EG-2121/2102CA series, 2006. Karta katalogowa.
- [45] R. Fernando, redaktor. *GPU Gems: programming techniques, tips, and tricks for real-time graphics*. Addison-Wesley, 2004.
- [46] R. Fernando, M. J. Kilgard. *Język Cg. Programowanie grafiki w czasie rzeczywistym*. Helion, 2003.
- [47] J. D. Foley, A. van Dam, S. K. Feiner, J. F. Hughes. *Computer graphics: principles and practice in C.* Addison-Wesley, 1995.
- [48] U.S. Food, Drug Administration. 510 (k) Guide for measuring and reporting acoustic output of diagnostic ultrasound devices, 1985.
- [49] F. Forsberg. Ultrasonic biomedical technology; marketing versus clinical reality. *Ultrasonics*, 42:17–27, 2004.
- [50] Message Passing Interface Forum. MPI-2: extensions to the Message-Passing Interface. Raport instytutowy, University of Tennessee, 2003.
- [51] F. S. Foster, C. J. Pavlin, K. A. Harasiewicz, D. A. Christopher, D. H. Turnbull. Advances in ultrasound biomicroscopy. *Ultrasound Med. Biol.*, 26(1):1–27, 2000.
- [52] B. Fraser, Ch. Murphy, F. Bunting. Real world color management. Peachpit Press, 2004.
- [53] S. W. Golomb, G. Gong. *Signal design for good correlation: for wireless communication, cryptography, and radar.* Cambridge University Press, 2005.
- [54] S. Goyal, A. Chatterjee, M. Atia. Reducing sampling clock jitter to improve snr measurement of A/D converters in production test. *Test Symposium, 2006. ETS '06. Eleventh IEEE European*, strony 165–172, 2006.

- [55] F. Gran, J. A. Jensen. Designing non-linear frequency modulated signals for medical ultrasound imaging. *Proc. IEEE Ultrason. Symp.*, strony 1714–1717, 2006.
- [56] K. Gray. The Microsoft DirectX 9 programmable graphics pipeline. Microsoft Press, 2003.
- [57] B. Haider, P. A. Lewin, K. E. Thomenius. Pulse elongation and deconvolution filtering for medical ultrasonic imaging. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 45(1):98–113, 1998.
- [58] F. J. Harris. On the use of windows for harmonic analysis with the discrete Fourier transform. *Proceedings of the IEEE*, 66(1):51–83, 1978.
- [59] F. M. Hendriks. *Mechanical behaviour of human epidermal and dermal layers in vivo*. Praca doktorska, Technische Universiteit Eindhoven, 2005.
- [60] J. L. Hennessy, D. A. Patterson. *Computer architecture: a quantitative approach*. Morgan Kaufmann, 2006.
- [61] J. Hyde. USB design by example: a practical guide to building I/O devices. Intel Press, 2001.
- [62] IEC. IEC/4WD 61966-2-1: Colour measurement and management in multimedia systems and equipment — part 2-1: Default RGB colour space — sRGB, 1998.
- [63] IEC. IEC standard 60601-2-37 (2002). medical electrical equipment, part 2: Particular requirements for the safety of ultrasonics medical diagnostic and monitoring equipment, 2002.
- [64] Intel. Intel SSE4 Programming Reference, 2007. Dokumentacja D91561-003.
- [65] J. A. Jensen, O. Holm, L. J. Jensen, H. Bendsen, H. M. Pedersen, K. Salomonsen, J. Hansen, S. Nikolov. Experimental ultrasound system for real-time synthetic imaging. *Proc. IEEE Ultrason. Symp.*, wolumen 2, strony 1595–1599, 1999.
- [66] H. W. Johnson. *Embedded computing a VLIW approach to architecture, compilers and tools*. Morgan Kaufmann, 2005.
- [67] T. Kęcik, P. Lewandowski, D. Kęcik, redaktorzy. *Metody obrazowania w okulistyce*. Klinika i Katedra Okulistyki AM, 2001.
- [68] W. Kester, redaktor. Data conversion handbook. Newnes, 2004.
- [69] K. Kunicka, L. Bieniaszewski, E. Świerblewska, H. Świątek, P. Kaczmarek-Kusznierewicz, P. Kruszewski, J. Neubauer-Geryk, E. Miszkowska, E. Drzazga. Znaczenie wyboru wskaźnika opisującego kompleks intima–media dla badania zależności z wybranymi czynnikami ryzyka sercowo-naczyniowego. *Nadciśnienie tętnicze*, 11(4):335–349, 2007.
- [70] M. Lewandowski, A. Nowicki. Softwarowa realizacja algorytmu kompresji ech w ultrasonografii kodowanej. 52 Otwarte Seminarium z Akustyki, strony 255–258, 2005. Poznań — Wagrowiec.
- [71] M. Lewandowski, A. Nowicki. High frequency coded imaging system with full software RF signal processing. *Proc. IEEE Ultrason. Symp.*, wolumen 1, strony 128–141, 2006.

- [72] J. Litniewski, A. Nowicki, I. Trots. Zastosowanie ultradźwięków kodowanych do badania własności kości gąbczastej. *Ultrasonografia*, 14(18), 2004.
- [73] R. Lou-Meller, W. Wolny, E. Ringgaard, A. Nowicki, M. Lewandowski, W. Secomski. Novel thick film transducers for high frequency ultrasonography. *Proc. IEEE Ultrason. Symp.*, strony 2397–2400, 2007.
- [74] R. G. Lyons. Understanding Digital Signal Processing. Prentice Hall, 2004.
- [75] B. R. Mahafza, A. Elsherbeni. *MATLAB Simulations for Radar Systems Design*. Chapman & Hall/CRC, 2003.
- [76] T. Mäller, E. Haines. Real-time rendering. A K Peters, 1999.
- [77] Maxim Integrated Products. *Defining and Testing Dynamic Parameters in High-Speed ADCs, Part 1*, 2001. Nota aplikacyjna AN728.
- [78] Maxim Integrated Products. *Dynamic Testing of High-Speed ADCs, Part 2*, 2001. Nota aplikacyjna AN729.
- [79] Maxim Integrated Products. *Coherent Sampling vs. Window Sampling*, 2002. Nota aplikacyjna AN1040.
- [80] Maxim Integrated Products. *Selecting the Optimum Test Tones and Test Equipment for Successful High-Speed ADC Sinewave Testing*, 2002. Nota aplikacyjna AN1819.
- [81] Maxim Integrated Products. MAX1215, 2006. Karta katalogowa.
- [82] G. McLaughlin. DSPs and zone sonography enable portable ultrasound. *RTC magazine*, (7), 2006.
- [83] T. McReynolds, D. Blythe. Advanced graphics programming using OpenGL. Morgan Kaufmann, 2005.
- [84] U. Meyer-Baese. *Digital signal processing with field programmable gate arrays*. Springer, 2001.
- [85] Microchip Technology. MCP1612, 2005. Karta katalogowa.
- [86] T. Miller. Managed DirectX 9 kick start: graphics and game programming. Sams, 2003.
- [87] T. Misaridis. *Ultrasound imaging using coded signals*. Praca doktorska, Technical University of Denmark, 2001.
- [88] T. X. Misaridis, K. Gammelmark, C. H. Jorgensen, N. Lindberg, A. H. Thomsen, M. H. Pedersen, J. A. Jensen. Potential of coded excitation in medical ultrasound imaging. *Ultrasonics*, 38:183–189, 2000.
- [89] G. V. Morris, L. L. Harkness, redaktorzy. *Airborne Pulsed Doppler Radar*. Artech House, 1996.
- [90] S. Natarajan. Automatic gain control for a small portable ultrasound device. Praca magisterska, Massachusetts Institute of Technology, 2001.

- [91] National Electrical Manufacturers Association. *Digital imaging and communications in medicine (DICOM). Part 1: Introduction and overview,* 2007.
- [92] National Electrical Manufacturers Association. *Digital imaging and communications in medicine (DICOM). Part 14: Grayscale standard display function digital imaging and communications in medicine (DICOM),* 2007.
- [93] National Semiconductor. LVDS Owner's Manual (3rd ed), 2004.
- [94] National Semiconductor. LM1086, 2005. Karta katalogowa.
- [95] National Semiconductor. LM1117, 2005. Karta katalogowa.
- [96] National Semiconductor. *Clock Conditioner Owner's Manual*, 2006. Nota aplikacyjna 1432.
- [97] S. I. Nikolov, J. P. Gomez Gonzalez, J. A Jensen. Real time 3D visualization of ultrasonic data using a standard PC. *Ultrasonics*, 41(6):421–426, 2003.
- [98] A. Nowicki. Wstęp do ultrasonografii. Medipage, 2003.
- [99] A. Nowicki, Z. Klimonda, M. Lewandowski, J. Litniewski, P. A. Lewin, I. Trots. Comparison of sound fields generated by different coded excitations experimental results. *Ultrasonics*, 44(1), 2006.
- [100] A. Nowicki, A. Kubera, K. Rene, P. A. Lewin, T. Pałko. Matched all-pass filtering of the received echoes for range improvement in medical ultrasound imaging. *Archives of Acoustics*, 22(3):307–331, 1997.
- [101] A. Nowicki, M. Lewandowski, W. Secomski, J. Litniewski, R. Tymkiewicz. High frequency imaging using coded Golay transmission. *Proc. IEEE Ultrason. Symp.*, wolumen 1, strony 128–141, 2005.
- [102] A. Nowicki, J. Litniewski, W. Secomski, P.A. Lewin, I. Trots. Estimation of ultrasonic attenuation in a bone using coded excitation. *Ultrasonics*, 41(8), 2003.
- [103] A. Nowicki, W. Secomski, J. Litniewski, I. Trots. On the application of signal compression using Golay's codes sequences in ultrasound diagnostic. *Archives of Acoustics*, 28(4), 2003.
- [104] A. Nowicki, I. Trots, P. A. Lewin, W. Secomski, R. Tymkiewicz. Influence of the ultrasound transducer bandwidth on selection of the complementary Golay bit code length. *Ultrasonics*, 47(1), 2007.
- [105] A. Nowicki, J. Wójcik, W. Secomski. Harmonic imaging using multitone nonlinear coding. Ultrasound Med. Biol., 33(7):1112–1122, 2007.
- [106] NVIDIA. NVIDIA GPU programming guide, wydanie wersja 2.4.0, 2005.
- [107] NVIDIA. NVIDIA GeForce 8800 GPU architecture overview, 2006.
- [108] NVIDIA. *NVIDIA CUDA compute unified device architecture. Programming guide*, wydanie wersja 1.0, 2007.

- [109] NVIDIA. NVIDIA Tesla Computing Technical Brief, wydanie wersja 1.0.0, 2007.
- [110] M. O'Donnell, Y. Wang. Coded excitation for synthetic aperture ultrasound imaging. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 52(2):171–176, 2005.
- [111] M. L. Oelze. Bandwidth and resolution enhancement through pulse compression. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 54(4):768–781, 2007.
- [112] M. L. Oelze. Improved axial resolution using pre-enhanced chirps and pulse compression. 2006 IEEE International Ultrasonics Symposium, strony 1083–1086, Vancouver, Canada, 2007.
- [113] European Federation of Societies for Ultrasound in Medicine, Biology. Clinical safety statement for diagnostic ultrasound. report from the European Committee for ultrasound radiation safety. *Eur. J. Ultrasound*, 16(3), 1996.
- [114] O. Oralkan, A. S. Ergun, J. A. Johnson, M. Karaman, U. Demirci, K. Kaviani, T. H. Lee, B. T. Khuri-Yakub. Capacitive micromachined ultrasonic transducers: Next-generation arrays for acoustic imaging? *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 49(11):1596–1610, 2002.
- [115] S. Park. *Principles of Sigma-Delta Modulation for Analog-to-Digital Converters*. Motorola, 1999. Nota aplikacyjna APR8.
- [116] M. H. Pedersen, T. X. Misaridis, J. A. Jensen. Clinical evaluation of chirp coded excitation in medical ultrasound. *Ultrasound Med. Biol.*, 29(6):895–905, 2003.
- [117] D. Pellerin, S. Thibault. Practical FPGA Programming in C. Prentice Hall, 2005.
- [118] Ch. Petzold. Programming Microsoft Windows with C#. Microsoft Press, 2002.
- [119] Ch. Petzold. Programming Microsoft Windows Forms. Microsoft Press, 2005.
- [120] M. Pharr, R. Fernando, redaktorzy. *GPU Gems 2: programming techniques for highperformance graphics and general-purpose computation.* Addison-Wesley, 2005.
- [121] M. Pollakowski, H. Ermert. Chirp signal matching and signal power optimization in pulse-echo mode ultrasonic nondestructive testing. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 41(5):655–659, 1994.
- [122] T. Powałowski. Rozwój badań ultradźwiękowych ściany naczyń tętniczych człowieka. LI Otwarte Seminarium z Akustyki, Gdańsk — Sobieszewo, strony 79–86, 2004.
- [123] Ch. Poynton. *Digital video and HDTV: algorithms and interfaces*. Morgan Kaufmann, 2003.
- [124] S. D. Pye, S. R. Wild, W. N. McDicken. Adaptive time gain compensation for ultrasonic imaging. *Ultrasound Med. Biol.*, 18(2):205–212, 1992.
- [125] N. A. H. K. Rao. Investigation of a pulse compression technique for medical ultrasound: a simulation study. *Medical and Biological Engineering and Computing*, 32(2):181–188, 1994.

- [126] N. A. H. K. Rao, S. Mehra, J. Bridges, S. Venkatraman. Experimental point spread function of FM pulse imaging scheme. *Ultrasonic Imaging*, 17(2):114–141, 1995.
- [127] D. Redmayne, E. Trelewicz, A. Smith. *Understanding the Effect of Clock Jitter on High Speed ADCs.* Linear Technology. Nota aplikacyjna 1013.
- [128] J. H. Reed. Software radio: a modern approach to radio engineering. Prentice Hall, 2002.
- [129] W. D. Richard, D. M. Zar, R. Solek. A low-cost B-mode USB ultrasound probe. Ultrasonic Imaging, 30(1):21–28, 2008.
- [130] M. A. Richards. Fundamentals of Radar Signal Processing. McGraw-Hill, 2005.
- [131] J. Richter. Advanced Windows. Microsoft Press, 1997.
- [132] R. H. Silverman, J. A. Ketterling, D. J. Coleman. High-frequency ultrasonic imaging of the anterior segment using an annular array transducer. *Ophthalmology*, 114(4):816–822, 2007.
- [133] P. Smith. *Little known characteristics of phase noise*. Analog Devices. Nota aplikacyjna AN-741.
- [134] K. A. Snook, H. U. Chang-Hong, T. R. Shrout, K. K. Shung. High-frequency ultrasound annular-array imaging. part I: Array design and fabrication. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 53(2):300–308, 2006.
- [135] T. A. Sturman. An evaluation of software defined radio. Raport instytutowy, QinetiQ Ltd, 2006.
- [136] T. L. Szabo. Diagnostic ultrasound imaging: inside out. Elsevier, 2004.
- [137] D. Tarditi, S. Puri, J. Oglesby. Accelerator: using data parallelism to program GPUs for general-purpose uses. Proceedings of the 12th international conference on architectural support for programming languages and operating systems., strony 325–335. ACM Press, 2006.
- [138] S. Taylor. Intel Integrated Performance Primitives. Intel Press, 2004.
- [139] Texas Instruments. ADS5474, 2007. Karta katalogowa.
- [140] Texas Instruments. *TMS320C64x/C64x+ DSP CPU and instruction set reference guide*, 2007. Dokumentacja SPRU732D.
- [141] D. M. Thiboutot. Dermatological applications of high-frequency ultrasound. *Proc. SPIE, Medical Imaging 1999: Ultrasonic Transducer Engineering*, wolumen 3664, strony 7–16, 1999.
- [142] I. Trots. *Coded excitation and echoes compression in ultrasonography*. Praca doktorska, IPPT PAN, 2005.
- [143] I. Trots, A. Nowicki, W. Secomski, J. Litniewski. Golay sequences side-lobe-canceling codes for ultrasonography. *Archives of Acoustics*, 29(1), 2004.
- [144] G. L. Turin. An introduction to matched filters. *IEEE Trans. Ultrason., Ferroelect., Freq. Contr.*, 6(3):311–329, 1960.

- [145] M. Vogt, H. Ermert, S. el Gammal, K. Kaspar, K. Hoffmann, P. Altmeyer. Structural analysis of the skin using high frequency, broadband ultrasound in the range from 30 to 140 MHz. *Proc. IEEE Ultrason. Symp.*, wolumen 2, strony 1685–1688, 1998.
- [146] Xilinx. Efficient Shift Registers, LFSR Counters, and Long Pseudo-Random Sequence Generators, 1996. Nota aplikacyjna XAPP052 (v1.1).
- [147] Xilinx. Programmable logic design quick start handbook, 2006.
- [148] Xilinx. Using Digital Clock Managers (DCMs) in Spartan-3 FPGAs, 2006. Nota aplikacyjna XAPP462 (v1.1).
- [149] Xilinx. Spartan-3 FPGA family: complete data sheet, 2007. Dokumentacja DS099.
- [150] Xilinx. System Generator for DSP. User Guide, 2007. Dokumentacja wersja 9.2.01.
- [151] Xilinx. Xilinx Power Estimator User Guide, 2007. Dokumentacja UG440.
- [152] Xilinx. XtremeDSP selection guide, 2007.
- [153] F. Xiong. Digital Modulation Techniques. Artech House, 2000.
- [154] R. Youmaran. Automatic measurement of features in ultrasound images of the eye. Praca magisterska, University of Ottawa, 2005.
- [155] D. M. Zar. A scan conversion engine for standard b-mode ultrasonic imaging. Praca magisterska, Washington University, 1993.
- [156] I. Załęska-Żyłka. Cellulit jako problem medyczny. *Problemy Higieny i Epidemiologii*, 89(4):487–491, 2008.
- [157] T. P. Zieliński. Od teorii do cyfrowego przetwarzania sygnałów. WKiŁ, 2006.