חלון הגדרות הפרויקט

לאחר הגדרת המערכת, עלינו להגדיר את הפרויקט, לשם כך ניגש לתפריט Project  ונבחר באפשרות Project Setup:

הגדרת נקודת ההתחלה והסיום של הפרויקט יעילות ביותר לצרכי ניווט, ע"י לחיצת כפתור אחת נוכל להגיע לתחילתו או סיומו של הקטע עליו אנו עובדים, עוד לגבי אפשרויות הניווט בהסברים על יחידת ה Transport.

יצירת Offset בהתאם לתיבות מוסיקאליות תתאפשר רק כשה Time Line/ציר הזמן של התוכנה יהיה במצב תיבות מוסיקאליות.

תהליך הדיגיטציה

בכדי להבין את ההשלכות הקשורות לקביעת תדירות הדגימה והסיביות עלינו להבין את תהליך הדגימה/ הדיגיטציה.

מהו גל קול?

ניקח כדוגמא גיטרה, כשנפרוט על אחד המיתרים, המיתר ישמיע צליל בשל תנועתו מעל ומתחת לציר שבו הוא מונח ישר ללא תנועה.
אם כן בכל פעם שהמיתר חולף דרך ציר ישר זה, הוא אינו משמיע צליל. הדבר קורה כמובן אין ספור פעמים בשנייה ולכן האוזן שלנו לא מסוגלת לאתר רגעי שקט אלו.
ומה לגבי הצליל? האם יש הבדל בצליל הנוצר מהתנועה כלפי מעלה של המיתר לבין הצליל הנוצר מהתנועה כלפי מטה?
כמובן שלא, מדובר בצליל זהה לחלוטין!

ננסה לתאר את הרעיון בצורה גראפית:

 

גל קול יוצר שינוי בלחץ הברומטרי, חלקו העליון של אותו גרף יתאר מצב של יצירת עלייה בלחץ וחלקו התחתון של הגרף יתאר מצב של יצירת תת לחץ, הציר האמצעי הוא ציר האפס המתאר מצב של שקט כלומר לא יהיו שינויים בלחץ הברומטרי.
לפניכם שירטוט מוגדל מאוד של מולקולות האוויר במצב של שקט, ובמצב של לחץ ותת לחץ ברומטרי:


ככל שהעוצמה תהיה חזקה יותר, כך השינויים בלחץ הברומטרי יהיו גדולים יותר ונקודות השיא בגרף יתרחקו יותר מהציר המרכזי. אנו מודדים את העוצמה בדציבלים dB.
מהלך אחד של שינוי הלחץ כלפי מעלה וכלפי מטה ייקרא מחזור, אם המחזור הזה קורה בפרק זמן של שנייה אחת הוא יקרא  1Hzהרץ אחד, אם קיימים 100 מחזורים כאלה בשנייה הם ייקראו 100Hz.
ככל שהתדירות גבוהה יותר, כלומר כמות המחזורים בשנייה גדולה יותר, כך גובה הצליל הטונאלי/ ה Pitch גבוה יותר, לדוג' קולו של רפי גינת ידגים גובה צליל טונאלי נמוך – קול בס, ואילו בלה מהסדרה פינוקיו תדגים את רעיון גובה הצליל הטונאלי הגבוה.
תחום ההיענות של האוזן האנושית של אדם ממוצע עד גיל 35 הוא בין 16Hz ועד ל 20,000Hz.

גל קול טהור בתדר 1000Hz משמש לכיוונים שונים באולפן ההקלטות וכן כרקע נעים לשקופיות המודיעות על הפסקת השידורים בטלוויזיה (כיום הפך להיות צליל נדיר למדי).

הצלילים שאנו שומעים מורכבים לרוב מתדירות יסוד, שקובעת את גובה הצליל הטונאלי, וכן תדירויות עיליות נלוות, הקובעות את אופי הצליל, כלומר את ההבדל בין צליל של כינור לזה של פסנתר המנגנים תו זהה.
בסוף המאה ה 19 הוכיח מדען בשם ז'אן בפטיסט פורייה כי כל הצלילים שאנו שומעים הם גלים מורכבים הניתנים לפירוק לגלי סינוס פשוטים (כמו בגרף שתיאר את הגיטרה) בתדירויות, עוצמות ומופעי פאזה שונים. לפיכך צליל הפסנתר אינו מגיע לאוזן שלנו כמספר תדרים במקביל, אלא כגל מורכב אחד הנוצר מסיכום כל התדרים.
עור התוף באוזן שלנו נע בהתאם לצורת הגל המורכב, בתוך האוזן קיימים זימים רבים שתפקידם להמיר את גל הקול למתחים משתנים שיועברו לכיוון המוח, כל אחד מהזימים יזוז רק בהתאם לתדירות שמתאימה לו בלבד, כאן מתבצע תרגום הגל המורכב למס' תדרים שונים שהמוח מזהה.
מינקות אנו יוצרים במוחנו בנק של צלילים המאפשר זיהוי ניתוח והבנה של גלי הקול ששמענו, החוקרים טוענים כי אדם מבוגר מסוגל להבחין בין כ 400,000 קולות שונים.

לפניכם דוג' לגל סינוס רגיל שהופך לגל מורכב בשלושה שלבים:

גל סינוס של 220Hz בהגדלה.


גל מורכב של 220Hz ו 440Hz בעוצמה זהה, בהגדלה.



גל מורכב של 220Hz, 440Hz ו 880Hz בעוצמה זהה, בהגדלה.

תיאורית הדגימה של נקוויסט

בשנת 1920במסגרת מחקריו עבור חברת AT&T ניסה מדען בשם הארי ניקוויסט לבדוק מתמטית את האפשרות להעביר אודיו מקודד בצורה דיגיטאלית דרך קווי טלפון.
בהסתמך על התיאוריה של פורייה שהוכיח כי גלי קול הינם קומבינציות שונות של גלי סינוס פרסם ניקוויסט מאמר הטוען כי מבחינה מתמטית ניתן לשחזר כל גל קול ובתנאי שינתנו שני ערכים שונים ע"ג מחזור אחד של גל הקול, כלומר יש למצוא את הערך של שתי נקודות לדוג':


לפיכך עלינו לדגום תדירות אותה אנו מעוניינים לשחזר לפחות בתדירות כפולה ממנה, בכדי שבוודאות יופיעו שתי נקודות דגימה במקום כלשהו ע"ג הגל הנדגם, כלומר תדירות של KHz20 נדגום בתדירות של KHz40 לפחות.
תדירות הדגימה הפופולארית היא 44.1KHz, זהו הסטנדרט לתקליטורי אודיו רגילים, כלומר נבצע 44,100 תמונות של הגל הנדגם בשנייה אחת, התדירות הנדגמת הגבוהה ביותר תהיה אם כן 22,050Hz.

ומהיכן הגיע הערך המספרי המוזר הזה? מדוע לא יכלו להסתפק ב40KHz?
הדעה הרווחת היא שניסו לקבוע מראש סטנדרט דגימה גבוה יותר מזה הנדרש, בכדי לוודא שלא נעלם מידע כלשהו שהאוזן האנושית עלולה להרגיש בו.
אולם התשובה הנכונה טמונה באמצעי האחסון של המידע הדיגיטאלי בתחילת הדרך, היום אנו נהנים לעבוד על כוננים קשיחים בנפחים של עשרות ג'יגה, אולם בתחילת הדרך סטנדרט האחסון היה מכשיר ווידיאו מסוג Umatic שחלוקת איזור הכתיבה בסרט ההקלטה בשנייה לקווי הוידיאו בסטנדרט הישראלי והאמריקאי נתן את התוצאה של 44,100 ערכים שונים, מאחר וניסו להישען על מכשירים קיימים בכדי להוזיל עלויות בתהליך יצירת תקליטורי האודיו, נקבע ערך זה כתדירות הדגימה הסטנדרטית.

Alias Noise

עד כאן הרעיון פשוט, אך מה יקרה אם למערכת הדוגמת ייכנס תדר בערך גבוה יותר מחצי מהתדירות הדוגמת?

אם תדר גבוה מדי ייכנס למערכת הדוגמת, נקבל רק ערך דגימה אחד, או פחות מזה, ע"ג מחזור אחד שלו. ערכים אלו ייצרו בתהליך שיחזור הגל תדרים שגויים, או בתרגום חופשי "תדרים מתחזים".
לדוג' נניח ודגמנו בטעות בתדירות של KHz48 קילוהרץ תדירות של KHz30 קילוהרץ, התדירות שתקרא תהיה בעצם ההפרש ביניהן כלומר KHz18, זהו גל מתחזה שכן הוא לא קיים בסיגנל המקורי.

בכדי למנוע את תופעת ה Alias Noise  נעשה שימוש בLow Pass Filter , פילטר שמונע מתדרים גבוהים לעבור דרכו, בתחילה נעשה שימוש בפילטר זה לפני הכניסה לתוך הממיר הדיגיטאלי, הבעיה הייתה שהפילטר לא באמת הצליח לבטל לחלוטין את כל התדרים הגבוהים מבלי לפגוע או לשנות את האות המקורי ולכן איכות הצליל נפגמה לפני הכניסה לממיר הדיגיטאלי.

הפתרון היה ליצור Low Pass Filter דיגיטאלי שיופעל אחרי תהליך הדגימה, הדבר התאפשר בזכות רעיון
ה Over Sampling, כלומר כל גל נדגם בעצם מס' פעמים בשנייה, לפיכך בהנחה שמדובר על תהליך דגימה שקורה 4 פעמים בשנייה בתדירות של KHz48, תדירות הדגימה הכוללת האפקטיבית תהיה KHz 192.

כעת באפשרותנו לדגום תדרים עד לגובה מקסימאלי של KHz96, אולם אין באפשרותנו לאחסן כל כך הרבה נתונים, לכן מופעל ה Low Pass Filter הדיגיטאלי שהוא גם זול מבחינת עלות הייצור שלו וגם מדויק ביותר ולכן הוא לא ישפיע על איכות הצליל הסופית.


עד לנקודה זו יש לנו רצף של תמונות/נקודות ציון לאורך ציר זמן אבל טרם נקבעה העוצמה של כל אחת מהן, לקביעת רזולוציות העוצמה אנו משתמשים בסיביות.

סיביות Bit

קומפקט דיסק רגיל עובד בסיביות של 16 Bit, זהו מס' בינארי בעל 16 מיקומי ספרות, כל ספרה יכולה להיות 0 או 1 לדוג:

0100111010001011

מאחר ולכל סיפרה יש רק שתי אפשרויות ומדובר ב 16 מיקומים שונים, נחשב זאת כ-2 בחזקת 16 כלומר 65,536 צירופים שונים או בעצם 65,536 ערכי עוצמה שונים משיא העוצמה בחלק העליון  של גל הסינוס ועד לשיא העוצמה בחלק התחתון של אותו הגל.
אם נעבור למשל לדגימה ב-8 ביט, נגיע באותו חישוב ל 256 ערכי עוצמה שונים בלבד.

בעולם הדיגיטאלי אנו מחויבים לעבוד בתוך הגבולות הברורים של המערכת, לכן אם ננסה להקליט בעוצמה חזקה יותר מהערך המספרי הגבוה ביותר הוא 65,536, הצליל המוקלט יתפרש כאות שגוי ובתהליך השחזור נשמע קליק דיגיטאלי חזק, במקום הקלטה זה.

בזמן ההקלטה כל דגימה שיש לה ערך מוחלט זהה לאחד מ 65,536 הערכים הקיימים תשמר נאמנה למקור, אולם מה יקרה לכל אותן דגימות שערכן הוא בין שתי נקודות עוצמה קיימות?


כל מי שלמד הנדסה יודע שבין כל שתי נקודות תמיד נוכל להוסיף נקודה נוספת, לפיכך דגימות רבות עלולות להופיע בין שתי נקודות עוצמה מוחלטות כלשהן.
המחשב שאינו מכיר בערכי האמצע מבצע פעולה הנקראת Quantize, אשר קובעת לדגימה את הערך המספרי הנמוך הקרוב ביותר לערך שנדגם.
פעולת ה Quantize יוצרת רעש בביטים התחתונים הנקרא Quantization Noise, רעש זה קובע את עוצמת רצפת הרעש של הממירים.




הגרפים הבאים מתארים את התחום הדינאמי של ממירי אודיו בסיביות של 8, 16, 24 ביט.
שימו לב שנקודת המקסימום של הממירים זהה בכל סיביות, ערך נקודת שיא העוצמה הוא 0dB Full Scale, עם זאת רצפת הרעש מתרחקת מנקודת המקסימום ככל שהסיביות גדלה.

גרפים אלו אינם לוקחים בחשבון את רעש העבודה הקבוע של המעגל האלקטרוני שמסביב לממירים שכן הוא משתנה מיצרן ליצרן.



 

 

 

 

מדוע הקלטה חזקה נשמעת טוב יותר מהקלטה חלשה במערכת דיגיטאלית?

נסתכל שוב על מספר בינארי של 16 ביט:

בהקלטה חלשה בעוצמה של -50 dB Full Scale נצליח לשנות את הערכים של שמונת הספרות הראשונות בלבד של ה Least Significant Bits, לפיכך למרות שאנו עובדים ב 16 ביט ניאלץ להשתמש ברזולוציה של 8 ביט בלבד.
אנו יודעים שמערכת הקלטה דיגיטאלית מבצעת Quantize של כל העוצמות שאין להן ערך מוחלט, אולם מה יהיה ההפרש בין נקודת עוצמה אחת לנקודת העוצמה הבאה? בכמה תעוות פעולת ה Quantize את שיחזור הגל?

לפניכם שרטוט המדגים כיצד שלבי ה Quantize מצטמצמים ככל שעוצמת הגל גדלה:


ככל שעוצמת ההקלטה תתחזק כך נוכל ליהנות מסיביות מוגברת, בעצם רק בעוצמה של  0 dB FS יבואו לידי ביטוי במלואם כל 65,536 שלבי ה Quantize של המערכת, אם נבצע הקלטה בעוצמה נמוכה מדי שלבי
ה Quantize יהיו כה רחוקים האחד מהשני שבתהליך השחזור נשמע שהצליל דל ומעוות.

אם כן ניצבת בפנינו בעיה, הקלטה בעוצמה חזקה מדי תיצור קליקים דיגיטאליים ואילו הקלטה חלשה עלולה להישמע רע, מה עושים?

קיימים שני פתרונות, הראשון, שימוש במכשיר קומפרסור לפני הכניסה לכרטיס הקול, הקומפרסור יקטין את התחום הדינאמי ויאפשר לנו לקרב את אותות הצליל החלשים לעבר העוצמה המיוחלת, הפתרון השני הוא להקליט בסיביות של 24 ביט, שלבי ה Quantize באזור ה 8 ביט העליונים יהיו קטנים מספיק לשחזור נאות של הגל, הקלטה באזור ה 8 ביט העליונים של ה Most Significant Bits במערכת 24 ביט, תיתן לנו תחום דינאמי של 48 dB, די והותר לרוב כלי הנגינה.

שימו לב, הקלטה בסיביות של 24 ביט תגדיל את נפח הקבצים ע"ג הדיסק הקשיח שלכם פי 1.5 ביחס להקלטה בסיביות של 16 ביט בתדירות דגימה זהה.

סוגי הקבצים הניתנים להקלטה

קובץ מסוג WAV יישמר בתקן PCM שנוצר במקור למחשבי PC, קובץ מסוג AIFF יישמר בתקן PCM שנוצר במקור למחשבי MAC, קובץ Wave 64 מאפשר לבצע הקלטת אודיו רציפה שגודלה יותר מ 2 Giga , הכרחי להקלטות ארוכות מרובות ערוצים בתקן 5.1, קובץ מסוג Broadcast Wav מכיל את נתוני מחבר היצירה וכן את מיקומו של הקובץ ביחס ל Time Line, שימושי בעיקר להעברת קבצים בין תוכנות אודיו שונות.