Προς το περιεχόμενο

"Αναλογική" vs. "ψηφιακή" δημιουργία


Προτεινόμενες αναρτήσεις

Χωρίς να είμαι καθόλου ειδικός (θα ήθελα την επιβεβαίωση κάποιου επιστήμονα του forum), να συμπεράνω ότι η δειγματοληψία (22 kHz.), έρχεται σε αυτό που πραγματικά μπορεί να ακούσει το αυτί μας?

Αυτό δεν είναι τίποτα, μπορεί κάποιος άλλος να σου πεί ότι ο Slash είναι ο καλύτερος κιθαρίστας του κόσμου... ;D

Το θεώρημα δειγματοληψίας των Shannon - Nyquist λέει ότι σε ένα φασματικά περιορισμένο σήμα με μέγιστη συχνότητα F μπορεί να γίνει άριστη δειγματοληψία με ρυθμό δειγματοληψίας 2F.

 

Φυσικά εκτός από τα F και 2F και τον κλασικό πολλαπλασιαμό 20khz*2=40 υπάρχει πολύ ψωμί στις παραδοχές του θεωρήματος, δηλαδή τι είναι φασματικά περιορισμένο σήμα και πώς το προσεγγίζουμε με τα φίλτρα μας...

 

Οπότε σε αυτό που ρωτάς η απάντηση είναι χοντρικά ναι αλλά υπάρχουν λεπτομέρειες

 

Η χροιά δεν έχει συχνοτική απόκριση. 

τι εννοείς; η χροια είναι στην ουσία σύνολο overtones, ο λόγος που ένα Λα στα 440 Hz ακούγεται αλλιώς στο πιάνο και στο βιολί

"[...] the stupid are cocksure while the intelligent are full of doubt."

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντήσεις 57
  • Πρώτη
  • Τελευταία

Περισσότερες συμμετοχές

Περισσότερες συμμετοχές

δηλαδή τι είναι φασματικά περιορισμένο σήμα και πώς το προσεγγίζουμε με τα φίλτρα μας...

 

Στον όρο "φασματικά περιορισμένο" σήμα είναι και όλο το ζουμί.

 

Το οποίο σημαίνει με απλούς κατανοητούς όρους ότι όσο το σήμα μας πλησιάζει το άνω συχνοτικό όριο (τα 22kHz στην περίπτωσή μας), το σήμα μας μπορεί να έχει μόνο μια μορφή: ημιτονικό. Οποιοδήποτε άλλο είδος σήματος, θα περιέχει υψηλότερες αρμονικές και άρα θα ξεφεύγει από το άνω όριο - οι οποίες αρμονικές θα "κόβονται" από τα φίλτρα που προηγούνται του A/D converter και τελικά το σήμα μας κοντά στο άνω όριο θα μετατρέπεται σε απλό ημιτονικό. Με ό,τι αυτό συνεπάγεται στην πιστότητα του σήματος.

 

Επίσης, κοντά στο άνω συχνοτικό όριο η δειγματοληψία κάθε περιόδου του ημιτόνου θα περιέχει δύο μόνο δείγματα (εφόσον παίρνει 44100 δείγματα το δευτερόλεπτο και το σήμα μας εκεί έχει 22050 κύκλους/περιόδους το δευτερόλεπτο - άρα 44100/22050=2 δείγματα/περίοδο). Με δύο μόνο δείγματα δεν μπορούμε να απεικονίσουμε επακριβώς το αρχικό μας σήμα, μόνο κατά πολύ μεγάλη προσέγγιση και με μεγάλα όρια λάθους πχ αν η δειγματοληψία γίνει κατά τη στιγμή που το ημίτονο περνάει από το "0", τότε αυτά τα 2 δείγματα θα απεικονίζουν μια flat μηδενική περιοχή ενώ στην πραγματικότητα υπάρχει σήμα. Βεβαίως σε τόσο υψηλές συχνότητες το αυτί δεν έχει τη διακριτική ικανότητα να εντοπίσει τέτοια σφάλματα, τουλάχιστον επικεντρωμένα. Αθροιστικά, στο συνολικό υψηλό συχνοτικό περιεχόμενο ενός σήματος, ίσως είναι σε θέση να αντιληφθεί μια γενικότερη αλλοίωση σε σχέση με το αρχικό σήμα (αναλόγως και της ποιότητας μετατροπής και ακρίβειας των A/D-D/A converters) αλλά βέβαια υπάρχουν κι άλλου είδους αλλοιώσεις που σχετίζονται με τη διαδικασία μετατροπής και διαμορφώνουν τη συνολική εικόνα.

 

Είναι άλλωστε εμφανής η τάση της αγοράς στη μετάβαση σε πιστότερη ψηφιοαναλογική μετατροπή, αυξάνοντας τη συχνότητα δειγματοληψίας (48kHz, 192kHz) καθώς και την ανάλυση σε bit (24bit).

 

Αρβύλες...

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Επίσης, κοντά στο άνω συχνοτικό όριο η δειγματοληψία κάθε περιόδου του ημιτόνου θα περιέχει δύο μόνο δείγματα (εφόσον παίρνει 44100 δείγματα το δευτερόλεπτο και το σήμα μας εκεί έχει 22050 κύκλους/περιόδους το δευτερόλεπτο - άρα 44100/22050=2 δείγματα/περίοδο). Με δύο μόνο δείγματα δεν μπορούμε να απεικονίσουμε επακριβώς το αρχικό μας σήμα, μόνο κατά πολύ μεγάλη προσέγγιση και με μεγάλα όρια λάθους πχ αν η δειγματοληψία γίνει κατά τη στιγμή που το ημίτονο περνάει από το "0", τότε αυτά τα 2 δείγματα θα απεικονίζουν μια flat μηδενική περιοχή ενώ στην πραγματικότητα υπάρχει σήμα.

...

Είναι άλλωστε εμφανής η τάση της αγοράς στη μετάβαση σε πιστότερη ψηφιοαναλογική μετατροπή, αυξάνοντας τη συχνότητα δειγματοληψίας (48kHz, 192kHz) καθώς και την ανάλυση σε bit (24bit).

Εδώ θα διαφωνήσω. Η δειγματοληψία ενός bandlimited σήματος με μέγιστη συχνότητα F με ρυθμό δειγματοληψίας 2F αρκεί για να μπορεί αυτό να ανακατασκευαστεί πλήρως από το ψηφιακό σήμα, παρά τον (φαινομενικά) μικρό αριθμό δειγμάτων ανά κύκλο που έχουμε στις υψηλότερες συχνότητες. Το έχω διευκρινίσει ξανά εδώ:

 

http://www.noiz.gr/index.php?topic=166311.msg298384#msg298384

 

Η μετάβαση στα 48, 96... kHz έχει νόημα, αλλά για άλλους λόγους. Δες το παρακάτω post του Νικόδημου:

 

http://www.noiz.gr/index.php?topic=166311.msg298877#msg298877

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Εδώ θα διαφωνήσω. Η δειγματοληψία ενός bandlimited σήματος με μέγιστη συχνότητα F με ρυθμό δειγματοληψίας 2F αρκεί για να μπορεί αυτό να ανακατασκευαστεί πλήρως από το ψηφιακό σήμα, παρά τον (φαινομενικά) μικρό αριθμό δειγμάτων ανά κύκλο που έχουμε στις υψηλότερες συχνότητες.

 

Το ίδιο πράγμα λέμε ουσιαστικά. Απλά εγώ λέω ότι ακριβώς επειδή το σήμα μας είναι bandlimited, οι συχνότητες κοντά στο όριο αποκοπής φτάνουν να μοιάζουν πλέον σαν καθαρά ημίτονα (ενώ αρχικά δεν ήταν), οπότε τα 2-3 δείγματα που τους αντιστοιχούν μπορούν να αποδώσουν την αρχική μορφή (προσεγγίσιμη σε τριγωνικό σήμα πλέον, αλλά το τριγωνικό εμπεριέχει το ημίτονο συν κάποιες αρμονικές - πλασματικά αυτές που έκοψε το φίλτρο).

 

Θα ήθελα όμως να μου εξηγήσεις πώς αυτό

 

αν η δειγματοληψία γίνει κατά τη στιγμή που το ημίτονο περνάει από το "0", τότε αυτά τα 2 δείγματα θα απεικονίζουν μια flat μηδενική περιοχή ενώ στην πραγματικότητα υπάρχει σήμα.

 

θα μας δώσει τέλεια ανακατασκευή του αρχικού σήματος...

 

Αρβύλες...

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Αυτο το προβλημα που περιγραφεις ειναι μια ειδικη περιπτωση του aliasing. Για να μη συμβει παιρνεις δειγματοληψια που "υπακουει" στο Θ. Shannon ή/και χρησιμοποιείς καποιο anti-aliasing φιλτρο.

 

Παντως για προβλεψη και αναλυση σηματος, χρησιμοποιουνται και συναρτησεις window που εξαλειφουν προβληματα σχετικα με το τμημα της κυμαρομορφης που δεχεται αναλυση. Αν καταλαβα καλα τι εννοεις, νομιζω οτι αυτη ειναι η απαντηση :)

 

http://zone.ni.com/devzone/cda/tut/p/id/4844

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Το ίδιο πράγμα λέμε ουσιαστικά. Απλά εγώ λέω ότι ακριβώς επειδή το σήμα μας είναι bandlimited, οι συχνότητες κοντά στο όριο αποκοπής φτάνουν να μοιάζουν πλέον σαν καθαρά ημίτονα (ενώ αρχικά δεν ήταν), οπότε τα 2-3 δείγματα που τους αντιστοιχούν μπορούν να αποδώσουν την αρχική μορφή (προσεγγίσιμη σε τριγωνικό σήμα πλέον, αλλά το τριγωνικό εμπεριέχει το ημίτονο συν κάποιες αρμονικές - πλασματικά αυτές που έκοψε το φίλτρο).

Στην επεξεργασία σήματος όταν μιλάμε για φασματική ανάλυση αναφερόμαστε ΠΑΝΤΑ στην ανάλυση Fourier δηλ. στην ανάλυση ενός σήματος σε άθροισμα ημιτόνων (και όχι square waves, triangle waves, sawtooths κλπ.) δεδομένων συχνότητων. Επομένως ΚΑΘΕ συχνοτικό κομμάτι του σήματος αντιστοιχει αναγκαστικά σε ημίτονο και το μόνο που μας ενδιαφέρει είναι ο συντελεστής Fourier που καθορίζει την ένταση αυτού του κομματιού.

 

Νομίζω ότι η σύγχυση προκύπτει από το γεγονός ότι ένα square wave ή οποιοδήποτε άλλο περιοδικό σήμα έχει και αυτό κάποιου είδους "συχνότητα" ίση με το αντίστροφο της περιόδου του. Όμως αυτή η "συχνότητα" ΔΕΝ είναι η συχνότητα στην οποία αναφερόμαστε όταν μιλάμε για τη φασματική ανάλυση του σήματος. Π.χ. η φασματική ανάλυση ενός square wave δεδομένης περιόδου δείχνει ως γνωστόν ότι το σήμα περιέχει ΑΠΕΙΡΟ πλήθος συχνοτήτων.

 

Θα ήθελα όμως να μου εξηγήσεις πώς αυτό

αν η δειγματοληψία γίνει κατά τη στιγμή που το ημίτονο περνάει από το "0", τότε αυτά τα 2 δείγματα θα απεικονίζουν μια flat μηδενική περιοχή ενώ στην πραγματικότητα υπάρχει σήμα.

θα μας δώσει τέλεια ανακατασκευή του αρχικού σήματος...

Αυτό που λές όντως ισχύει όταν η συχνότητα είναι ΑΚΡΙΒΩΣ ίση με τη συχνότητα αποκοπής (π.χ. 22.05 kHz σε δειγματοληψία 44.1 kHz), αλλά δεν ισχύει "κοντά" στη συχνότητα αποκοπής. Δηλ, όντως δεν μπορούμε να ανακατασκευάσουμε το κομμάτι συχνότητας 22.05 kHz, αλλά μπορούμε να ανακτήσουμε πλήρως το κομμάτι συχνότητας 22.049 kHz.

 

Για να διευκρινιστεί αυτό γράφω επακριβέστερα το θεώρημα Shannon-Nyquist (και εγώ και ο skantzos ήμασταν λίγο βιαστικοί όταν το γράφαμε):

 

Η δειγματοληψία ενός bandlimited σήματος με μέγιστη συχνότητα F με ρυθμό δειγματοληψίας >2F αρκεί για να μπορεί αυτό να ανακατασκευαστεί πλήρως από το ψηφιακό σήμα.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Τέλος πάντων, η διαφωνία προκύπτει γιατί το εν λόγω θεώρημα αναφέρεται σε ιδεατές καταστάσεις και με έναν ιδεατό τέλειο ψηφιοαναλογικό μετατροπέα. Κλασική περίπτωση φυσικομαθηματικής προσέγγισης ενός φαινομένου και φυσικά πάρα πάρα πολύ κοντά στην πραγματικότητα.

 

Όχι spot-on όμως, γιατί ούτε ιδεατές συνθήκες έχουμε, ούτε ιδανικό ψηφιοαναλογικό μετατροπέα. Ομολογώ ότι όλο το σκεπτικό μου ήταν βασισμένο σε πραγματικές πρακτικές τεχνικές και κυκλώματα A/D-D/A που φυσικά απέχουν από το ιδεατό (άλλα λίγο, άλλα πολύ). Φυσικά με διάφορες τεχνικές κάποια προσεγγίζουν πολύ καλά το ιδεατό, παρ'όλα αυτά - και ειδικά με νορμάλ καθημερινές συνθήκες χρήσης (μέτριοι converters κλπ) - απέχουν λιγάκι από αυτό.

 

Γι αυτό και μίλησα για την τάση αύξησης του sampling rate. Εντελώς πρακτικά είναι ευκολότερο απλά να αυξήσεις το sampling rate για να επιτύχεις καλύτερο (=πιστότερο) encoding παρά να φτιάξεις ποιοτικότερο encoder.

 

Οπότε μάλλον κι εγώ ήμουν λίγο βιαστικός και δεν διευκρίνισα ότι μιλούσα για πρακτικές εφαρμογές και συνθήκες.

 

Για το θέμα "ανάλυση Fourier" που αναφέρθηκε παραπάνω, φυσικά και το γνωρίζω αλλά δεν εννοούσα κάτι που έχει να κάνει άμεσα με αυτό. Απλά ότι λόγω πρακτικών αναγκών (πάλι πρακτικά) τα φίλτρα αποκοπής που χρησιμοποιούνται δεν είναι ιδεατά και τέλεια με αποτέλεσμα να μετατρέπουν σε σχεδόν καθαρό ημίτονο ένα εύρος χρήσιμων συχνοτήτων κοντά στη συχνότητα αποκοπής. Πράγμα που προφανώς αλλοιώνει το αρχικό σήμα σε αυτές τις περιοχές αφού συμβαίνει πριν τη μετατροπή σε ψηφιακό και όλες οι τεχνικές που χρησιμοποιούνται (dithering, adaptive focus κλπ) εφαρμόζονται στο αλλοιωμένο σήμα αυξάνοντας το ποσοστό αλλοίωσης από το αρχικό αναλλοίωτο σήμα.

 

Anyway, το bottom line που εννούσα γενικά είναι ότι πρακτικά τα πράγματα δεν είναι τόσο ρόδινα όσο τα παρουσιάζει η θεωρία. Τουλάχιστον όχι με τυπικό εξοπλισμό και μεθόδους. Ούτε και δραματικά βέβαια, αλλά αν θέλουμε να ακριβολογούμε για την πραγματικότητα, αλλοίωση (more often than not) υπάρχει. Μικρή ναι, σχεδόν ίσως μη αντιληπτή ναι, αλλά υπάρχει.

 

Και επειδή παραπάνω παρατέθηκε το θεώρημα, νά και η αντίστοιχη πράξη από την ίδια πηγή (wikipedia):

 

In practice, the continuous signal is sampled using an analog-to-digital converter (ADC), a non-ideal device with various physical limitations. This results in deviations from the theoretically perfect reconstruction capabilities, collectively referred to as distortion.

 

Various types of distortion can occur, including:

 

   * Aliasing. A precondition of the sampling theorem is that the signal be bandlimited. However, in practice, no time-limited signal can be bandlimited. Since signals of interest are almost always time-limited (e.g., at most spanning the lifetime of the sampling device in question), it follows that they are not bandlimited. However, by designing a sampler with an appropriate guard band, it is possible to obtain output that is as accurate as necessary.

   * Integration effect or aperture effect. This results from the fact that the sample is obtained as a time average within a sampling region, rather than just being equal to the signal value at the sampling instant. The integration effect is readily noticeable in photography when the exposure is too long and creates a blur in the image. An ideal camera would have an exposure time of zero. In a capacitor-based sample and hold circuit, the integration effect is introduced because the capacitor cannot instantly change voltage thus requiring the sample to have non-zero width.

   * Jitter or deviation from the precise sample timing intervals.

   * Noise, including thermal sensor noise, analog circuit noise, etc.

   * Slew rate limit error, caused by an inability for an ADC output value to change sufficiently rapidly.

   * Quantization as a consequence of the finite precision of words that represent the converted values.

   * Error due to other non-linear effects of the mapping of input voltage to converted output value (in addition to the effects of quantization).

 

The conventional, practical digital-to-analog converter (DAC) does not output a sequence of dirac impulses (such that, if ideally low-pass filtered, result in the original signal before sampling) but instead output a sequence of piecewise constant values or rectangular pulses. This means that there is an inherent effect of the zero-order hold on the effective frequency response of the DAC resulting in a mild roll-off of gain at the higher frequencies (a 3.9224 dB loss at the Nyquist frequency). This zero-order hold effect is a consequence of the hold action of the DAC and is not due to the sample and hold that might precede a conventional ADC as is often misunderstood. The DAC can also suffer errors from jitter, noise, slewing, and non-linear mapping of input value to output voltage.

Αρβύλες...

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Και συγνώμη, αλλά στο παραπάνω άρθρο μόνο για ανησυχία γονέων διάβασα και την άποψη μιας συγγραφέως βιβλίου. Ούτε μελέτες είδα ούτε επιστημονικά δεδομένα που υποστηρίζουν ότι το το να γράφεις λιγότερο με στυλό και περισσότερο με πληκτρολόγιο όταν είσαι παιδί, έχει ως αποτέλεσμα το τάδε και το δείνα...

 

ΥΓ. Φανταστείτε δύο ανθρώπους των σπηλαίων να συζητάνε για το αν είναι καλό να γράφεις με μελάνι σε χαρτί ή με αίμα βούβαλου στα τοιχώματα...

 

Pascal, σε πόσα άρθρα που διαβάζεις στον καθημερινό τύπο βλέπεις παραπομπές σε βιβλιογραφία επιστημονικών άρθρων? Δεν μου φάνηκαν φαιδροί οι ισχυρισμοί, ίσα ίσα που συμφωνώ απόλυτα. Και το παράδειγμά σου δεν έχει καμία σχέση γιατί δεν μιλάμε για το... είδος της γραφικής ύλης αλλά για την επαφή των χεριών με κάτι το πρωτογενές, με χαρτί, καμβά, πινέλα, έντονα real life χρώματα που θα τα μυρίσεις, θα λεκιαστείς, θα τα μιξάρεις για να τα δημιουργήσεις και όχι ένα mouse και μια οθόνη. Ακόμη και η κούραση του να γράφεις ή να ζωγραφίζεις, και να βλέπεις τα γράμματά σου ή τις ζωγραφιές σου με σάρκα και οστά μπροστά σου είναι κάτι εντελώς διαφορετικό από την πιο απρόσωπη και πολλές φορές άψυχη διαδικασία του point and click, η οποία (δεν έχω διαβάσει σχετικά βιβλία αλλά πιθανολογώ πως λένε κάτι παρόμοιο) φέρνει μια υποσυνείδητη αποστασιοποίηση από τη διαδικασία. Δεν έχει σημασία το τι θα μάθεις αλλά και πώς θα το μάθεις.

 

Και να σου πω κάτι ακόμη? Αν δεν δοθεί η ευκαιρία στο παιδί να ασχοληθεί με μπογιές και μολύβια και πάει κατευθείαν σε pc εξ αρχής, νομίζεις πως πράγματι θα τρέξει στο Microsoft Paint ή μόλις ανοίξει το pc θα μπει κατευθείαν πχ. στο Facebook και στο World of Warcraft? Μη μου πεις πως είναι άλλο θέμα αυτό γιατί δεν είναι... Πολύ πιο εύκολα θα δοθεί το έναυσμα να δημιουργήσει με τα χέρια του εκτός pc παρά να κάνει κάτι παρόμοιο ανοίγοντας το pc.

 

 

 

ΥΓ. Νομίζω πως μετά από ένα μεγάλο κύκλο ερχόμαστε στην καρδιά του αρχικού ερωτήματος, που ξαφνικά μου φαίνεται πολύ ενδιαφέρουσα...  :)  (αν και αρχικά ο τίτλος ήταν "analog vs. digital" και τα επιχειρήματα κάπως συγκεχυμένα και ατάκτως ερριμένα)

Fear no more the heat o' the sun

Nor the furious winter's rages

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργήστε λογαριασμό

Γραφτείτε στην παρέα μας. Είναι εύκολο!

Δημιουργία λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Σύνδεση

×
×
  • Δημοσιεύστε κάτι...

Τα cookies

Τοποθετήθηκαν cookies στην συσκευή σας για να είναι πιο εύκολη η περιήγηση στην σελίδα. Μπορείτε να τα ρυθμίσετε, διαφορετικά θεωρούμε πως είναι OK να συνεχίσετε. Πολιτική απορρήτου