מֵידָע

1.5: מבוא לאלגוריתמים והסקת הסתברות - ביולוגיה


1. לדוגמה, שקול את ה- PWM הבא למוטיב באורך 4:

אנו אומרים כי מוטיב זה יכול ליצור רצפים באורך 4. PWMs בדרך כלל מניחים שהתפלגות של מיקום אחד אינה מושפעת מבסיס של עמדה אחרת. שים לב שכל עמדה קשורה בהתפלגות הסתברות על הנוקלאוטידים (הם מסתכמים ב -1 ואינם שליליים).

2. אנו יכולים גם לדגמן את התפלגות הרקע של נוקלאוטידים (ההתפלגות הנמצאת על פני הגנום):

שימו לב כיצד ההסתברויות עבור A ו- T זהות וההסתברויות של G ו- C זהות. זוהי תוצאה של ה- DNA המשלימה המבטיח כי ההרכב הכולל של A ו- T, G ו- C זהה בסך הכל בגנום.

3. שקול את הרצף (S = GCAA. )

  • ההסתברות שהמוטיב ייצר רצף זה היא [P (S | M) = 0.4 × 0.25 × 0.1 × 1.0 = 0.01. לא מספר]
  • ההסתברות שהרקע ייצר רצף זה [P (S | B) = 0.4 × 0.4 × 0.1 × 0.1 = 0.0016. לא מספר]

4. לבד זה לא מעניין במיוחד. עם זאת, בהתחשב בשבר של רצפים שנוצרים על ידי המוטיב, למשל P (M) = 0.1, ובהנחה שכל הרצפים האחרים נוצרים על ידי הרקע (P (B) = 0.9) נוכל לחשב את ההסתברות שהמוטיב יצר את הרצף באמצעות חוק בייס:

[ begin {align*} P (M | S) & = frac {P (S | M) P (M)} {P (S)} [4pt] & = frac {P (S | M) P (M)} {P (S | B) P (B)+P (S | M) P (M)} [4pt] & = frac {0.01 times 0.1} {0.0016 times 0.9 + 0.01 פעמים 0.1} = 0.40984 סוף {יישר*} ]


צפו בסרטון: Data Structures: Heaps (יָנוּאָר 2022).