Tiefpass < Computergraphik < Praktische Inform. < Hochschule < Informatik < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 00:13 Mo 05.02.2007 | Autor: | Bastiane |
Hallo!
Kann mir jemand die unteren beiden Bildchen erklären?
[Dateianhang nicht öffentlich]
Ein Tiefpass lässt ja nur die tiefen Frequenzen durch und die hohen nicht. Aber was genau steht bei den unteren beiden Bildchen auf der x-Achse? Und was bedeutet das? Das verstehe ich irgendwie nicht.
Viele Grüße
Bastiane
Dateianhänge: Anhang Nr. 1 (Typ: PNG) [nicht öffentlich]
|
|
|
|
Hallo Bastiane,
das ist das klassische Dilemma bei der Filterung. Hat man einen idealen Tiefpass im Frequenzraum, bekommt man Hubbel im Bildraum. Ist das Bild ganz glatt, sieht die Frequenzraumdarstellung der Filtermaske kompliziert aus.
> Aber was genau steht bei den unteren beiden Bildchen auf der x-Achse?
Passenderweise x. Die unteren Bilder stellen das Signal im ursprünglichen Raum dar, während die oberen ja im Fourierraum sind.
> Und was bedeutet das?
Das bedeutet, dass man sich durch das stumpfe (in diesem Fall scharfkantige) Abschneiden der hohen Frequenzen im Frequenzraum Artefakte (Ringing) einhandelt. Diese haben die Form solcher Hubbel. Man hätte erwartet, dass das Bild ja glatt ist, weil man ja nur noch tiefe Frequenzen haben wollte. Dummerweise stehen die hohen und tiefen Frequenzanteile in einem prekären Gleichgewicht, das durch so radikale Schnitte zerstört wird. Um das zu verhindern, muss man die scharfe Kante des idealen Tiefpasses verschleifen und kommt dann (im Idealfall) auf eine Gaußkurve. Aber das ist ein paar Schritte weiter...
Zufälligerweise habe ich noch Bilder aus meinem Seminarvortrag. Originalbild und mit einem idealen Tiefpass gefiltertes Bild:
[Dateianhang nicht öffentlich]
[Dateianhang nicht öffentlich]
Recht schön nachzulesen ist das im Tönnies: "Grundlagen der Bildverarbeitung".
Gruß
Martin
Dateianhänge: Anhang Nr. 1 (Typ: png) [nicht öffentlich] Anhang Nr. 2 (Typ: png) [nicht öffentlich]
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:42 Mo 05.02.2007 | Autor: | Bastiane |
Hallo Martin!
Vielen Dank für deine Antwort.
> > Aber was genau steht bei den unteren beiden Bildchen auf
> der x-Achse?
> Passenderweise x. Die unteren Bilder stellen das Signal im
> ursprünglichen Raum dar, während die oberen ja im
> Fourierraum sind.
Und was ist x?
> > Und was bedeutet das?
> Das bedeutet, dass man sich durch das stumpfe (in diesem
> Fall scharfkantige) Abschneiden der hohen Frequenzen im
> Frequenzraum Artefakte (Ringing) einhandelt. Diese haben
> die Form solcher Hubbel. Man hätte erwartet, dass das Bild
> ja glatt ist, weil man ja nur noch tiefe Frequenzen haben
> wollte. Dummerweise stehen die hohen und tiefen
> Frequenzanteile in einem prekären Gleichgewicht, das durch
> so radikale Schnitte zerstört wird. Um das zu verhindern,
> muss man die scharfe Kante des idealen Tiefpasses
> verschleifen und kommt dann (im Idealfall) auf eine
> Gaußkurve. Aber das ist ein paar Schritte weiter...
Also, das mit dem Ringing Effekt steht bei uns direkt ein paar Folien weiter. Und der Gauss'sche Tiefpass kommt auch direkt hinterher. Aber ich verstehe nicht so ganz, wodurch das Ringing zustande kommt.
In den unteren Bildern steht doch auch noch der Tiefpass, aber im Ortsraum. Vielleicht kannst du doch nochmal genauer erklären, was auf x- und y-Achse steht.
Und was ist ein prekäres Gleichgewicht? Und was stelle ich mir eigentlich bei Bildern unter "Frequenzen" vor?
> Recht schön nachzulesen ist das im Tönnies: "Grundlagen der
> Bildverarbeitung".
Aha - mal sehen, ob ich das irgendwo in der Bibliothek finde...
Viele Grüße
Bastiane
|
|
|
|
|
Hallo Bastiane,
mir scheint, euch wurde gar nicht erklärt, was es mit den Filtern und den Bildchen auf sich hat...
Die vier Bildchen in deinem Posting sind jeweils verschiedene Darstellungen desselben Sachverhaltes.
Oben hast du die Frequenzraumdarstellung (Fourierraumdarstellung) und unten die Bildraum- oder Ortsraumdarstellung.
Die Transformation zwischen unten und oben ist die Fourier-Transformation, die du als Mathematikerin irgendwo schon einmal gesehen hast?
Während man im Bildraum ein (im speziellen Bildverarbeitungsfall) Bild(-signal) durch die Überlagerung einzelner Pixelhelligkeiten an x- und y-Positionen darstellt, wählt man im Fourierraum anstelle der "Basispixelbilder" komplexe Schwingungen der Form [mm] $e^{i\phi}$. [/mm] Das heißt, man drückt das Bild als Linerakombination verschiedener Schwingungen aus. Ein Bild mit großen Helligkeitsunterschieden zwischen benachbarten Pixeln (z.B. viele Kanten oder starkes Rauschen) wird einen hohen Anteil an hohen Frequenzen haben, ein glattes Bild wird einen niedrigen Anteil an hohen Frequenzen haben.
Ich denke, du solltest vielleicht mal einen Blick auf die (diskrete) Fourier-Transformation werfen (s. obige Quelle oder Wikipedia). Aber nur grob...
> Und was ist x?
Je nach Art des Signals:
Bei einer Messung über einen Zeitraum ist das die Zeitkoordinate.
Bei einer Messung im Raum (1D, 2D oder schlimmer) ist das die Raumkoordinate. Hier ist es im 1D einfach nur die Position im gesamten eindimensionalen Signal. Als Bild wäre das ein bestimmtes Pixel in einer Bildzeile.
> Aber ich verstehe nicht so ganz, wodurch das Ringing zustande kommt.
Hmm, das hat natürlich mit der Fourier-Transformation des im Frequenzraum so einfach aussehenden Filters zu tun.
Frei nach dem Tönnies:
Die inverse Fourier-Transformierte (also die Darstellung der einen Stufe des idealen TP im Bildraum) sieht so aus:
$f(u) = [mm] \bruch{sin(\pi*u*K)}{\pi*u*K}$,
[/mm]
wobei K die Breite des Filters ist (x-Achse in den oberen Bildchen) und u die Wellenzahl oder "diskrete Frequenz" ist. Hierzu wieder ein Verweis auf die Quellen zu Fourier-Transformation. Die obige Funktion wird übrigens auch sinc-Funktion genannt (auch in der Wikipedia zu finden).
> In den unteren Bildern steht doch auch noch der Tiefpass, aber im Ortsraum. Vielleicht kannst du doch nochmal genauer erklären, was auf x- und y-Achse steht.
Nun, die Darstellung im Ortsraum ist sozusagen die kanonische Darstellung eines Bildes. Die Basis besteht aus M*N Basisbilder, bei denen jeweils ein Pixel die volle Helligeit hat und alle anderen völlig dunkel sind.
In deinen Bildchen haben wir es mit einem eindimensionalen Signal zu tun, also nur mit N Pixeln (im Diskreten). Also bezeichnet x die Position des Pixels bezogen auf das Zentrum der Filtermaske (des Filterkerns) an. y ist die Helligkeit (Intensität) des jeweiligen Pixels.
Falls du es mit Signalen im Kontinuierlichen zu tun hast, dann sind es eben nicht Pixel sondern kontinuierliche Koordinaten und kontinuierliche Helligkeitswerte.
> Und was ist ein prekäres Gleichgewicht?
Na ja, das habe ich nur so ausgedrückt. Ich meinte, dass man durch das Entfernen bestimmter Frequenzberiche das gesamte Bild beeinflusst, weil man Frequenzen wegnimmt, die andere ausgleichen. Aber das wird vielleicht klarer, wenn du mal Bilder zum Thema Fouriertransformation siehst. Besonders bei einem Rechteckimpuls (im Ortsraum) sieht man, dass man wegen der scharfen Kanten alle Frequenzanteile benötigt, um das Bild linear zu kombinieren.
> Und was stelle ich mir eigentlich bei Bildern unter "Frequenzen" vor?
Nun, wie gesagt: Sie bilden die Basis einer anderen Darstellung desselben Bildes. Ist vielleicht etwas konfus im obigen Text, also verweise ich wieder auf seriöse Quellen.
Gruß
Martin
|
|
|
|