簡介

此《發行公告》含括下列主題:

  • 安裝相關的注意事項

  • 功能更新

  • 與核心相關之更新

  • 驅動程式更新

  • 技術搶先版

  • 已解決的問題

  • 已知問題

部份 Red Hat Enterprise Linux 4.8 的更新並沒有包括在此版本的發行公告內。您可以在下列網址找到最新的 Red Hat Enterprise Linux 4.8 發行公告:

http://www.redhat.com/docs/manuals/enterprise/

生命週期

Red Hat Enterprise Linux 4 的生命週期可以在此找到:https://www.redhat.com/security/updates/errata/

如之前的宣佈,推出 Red Hat Enterprise Linux 4.8 象徵 RHEL 4 的投產第二階段。在這階段中,不會再啟用新的硬體。

https://www.redhat.com/archives/nahant-list/2008-July/msg00059.html

用戶請注意:訂閱服務能存取的,仍然受支援的 RHEL 服務依舊不變。

安裝相關的注意事項

下列部份包括 Red Hat Enterprise Linux 的安裝、以及安裝程式 Anaconda 的特定資訊。

注意

當要由一個次要版本的 Red Hat Enterprise Linux 4(例如 4.6 至 4.7)更新至 4.8 時,我們建議您使用 Red Hat Network 來這麼做,您可透過管理的網站用戶介面或是 Red Hat Network Satellite 來執行。

若是您要在沒有網路連線的情況下升級一部系統,請使用 Anaconda 的「升級」功能。不過請注意,Anaconda 對於像是額外儲存庫或第三方應用程式上相依性的問題處理功能是有限的。另外,Anaconda 會將安裝錯誤回報在日誌檔案中,而不是互動式地回報。

正因如此,Red Hat 建議當您為離線的系統進行升級時,您應先測試並驗證您升級設定的完整性。請在將升級套用至您的生產環境前,先行確認並小心地檢查更新的日誌中是否含有任何錯誤。

重大 Red Hat Enterprise Linux 版本之間(比方說從 Red Hat Enterprise Linux 3 升級至 Red Hat Enterprise Linux 4.8)的原機本地升級(In-place upgrade)不被支援。雖然 Anaconda 的「升級」選項可讓您進行此動作,不過卻無法保證如此更新可完成有效的安裝。重大版本之間所進行的原機本地升級將無法保留所有的系統設定、服務以及自訂配置。因為此原因,Red Hat 強烈建議您,若您計畫在兩個重大版本之間進行升級,請進行一項全新的安裝。

  • 假如您打算複製 Red Hat Enterprise Linux 4.8 的光碟片內容(例如為了要準備網路安裝),請記得「」複製作業系統的光碟片,請勿複製 Extras 光碟或任何不同等級產品的光碟片,因為這麼做的話將會覆蓋掉 Anaconda 正常操作所需的檔案。

    這些光碟片必須在「安裝完」Red Hat Enterprise Linux 後,才進行安裝。

  • 發佈於 Red Hat Enterprise Linux 4(以及所有更新)中的 GRUB 版本不支援軟體 software mirroring(RAID 1)。因此,若您在一個 RAID 1 分割區上安裝 Red Hat Enterprise Linux 4 的話,開機程式會被安裝在第一個硬碟上而不是主開機記錄(MBR)中。這會使系統無法啟動。

    若您希望在一個 RAID 1 分割區上安裝 Red Hat Enterprise Linux 4 的話,您首先應將先前存在的任何開機程式由 MBR 中清除掉。

  • 當在一部使用 LCD 螢幕以及某些 ATI 顯示卡的系統上以文字模式來安裝 Red Hat Enterprise Linux 4 時,畫面有可能會偏掉。當此問題發生時,畫面上有些部份就會被隱藏住。

    若發生了這種情況的話,請使用 linux nofb 這個參數來進行安裝。

  • 當從 Red Hat Enterprise Linux 4.6 升級至此版本時,minilogd 可能會記錄到幾個 SELinux 的拒絕。這些錯誤記錄無害,並且可被忽略。

  • 之前,Anaconda 的 kickstart 文件(位於 /usr/share/doc/anaconda-<anaconda-version>/kickstart-docs.txt)描述了 kickstart 檔案的 --driveorder 選項:

    Specify which drive is first in the BIOS boot order.
                                            

    然而,事實上 --driveorder 選項需要系統上所有磁碟的清單,第一個開機裝置必須現在這清單的首位。有了這項更新後,這文件現在描述更清楚,內容如下:

    Specify which drive is first in the BIOS boot order.
    The ordered list must include all the drives in the system.
                                            

    在 kickstart 檔案中使用 --driveorder 選項時,排序過的清單應該要包括系統上所有磁碟。

功能升級

  • Red Hat Enterprise Linux 4 現在完全支援 systemtapSystemtap 提供免費軟體(GPL)基礎架構來讓取得執行 Linux 系統的資訊更容易。如此便能輔助檢測性能或功能問題。有了 systemtap 的協助,程式開發員不在需要透過冗長與繁複的方式來重新編輯、安裝與重新開機,來取得所需要的資料。

    請注意,新版 RHEL 或一些 Linux 系統上 systemtap 的功能,可能無法在 RHEL 4 上面運作,因為核心缺少某些功能之故。核心缺少 utrace 不支援使用者空間的偵測空能。

  • dmidecode 能提供 BIOS 與主機板版本的訊息。加上這 dmidecode 建議更新的 kernel-utils 版本從 2.2 到 2.9 都有。這版本能辨識出更新的處理器、PCI-express 插槽與裝置、以及 blade 機台。它也能提供 SMBIOS v2.6 規格的更高支援。

  • 本版本包括更新的 kernel-utils,將 Intel 的 microcode 檔案更新到 20080910 版本,以支援更新的 Intel 處理器。

  • smartmontools 已經支援 HP ProLiant 硬體裡,更新的 CCISS 控制卡。

  • Samba 套件已經重新製作並放回上游的軟體庫中,版本為 3.0.33。3.0.x 系列版本是 Samba 的分支,為了修正一些錯誤。使用 3.0.33 包括了數個重要的錯誤修正與安全性修正。本版本沒有更新的功能。

    欲知更多上游內容的詳情,請參閱 Samba 的《發行公告》:http://samba.org/samba/history/samba-3.0.33.html

  • ipmitool 已經更新到上游版本 1.8.11,修正了數個問題,功能也更為精進,包括:

    • 文件更新

    • 修正 SDR/FRU、SOL 等錯誤

    • 新指令與選項

    請注意 -K 命令行切換選項的行為已經改變,從 prompt for Kg key(提示使用者輸入 Kg key)變為 read Kg key from environment variable(從環境變數讀取 Kg key)。-Y 旗標的行為如之前版本的 -K

與核心相關的升級

  • 之前 ptrace 程式碼裡面少了 x86_64 的一項記號,會讓 x86_64 架構下對 i386 應用程式偵錯時,導致 gdb 失敗。有了這項更新後,這問題已經修正。

  • 卸載 ibmphp 模組並不安全。之前避免 ibmphp 模組卸載的機制並不夠用,漸漸地就會導致錯誤發生而終止。現在避免這模組卸載的方法已經更為精進,不再發生錯誤。然而,試著卸載模組可能會導致訊息日誌中出現警告,表示卸載模組並不安全。這警告可以忽略不計。

  • 在這項更新中,32 位元的 x86 系統如果有超過 64GB 的記憶體,那麼實體記憶體會被限制在 64GB。核心會把記憶體分成兩個獨立的區域:Lowmem 與 Highmem,前者在任何時候都對應到核心的位址空間;後者會在需要時,對應到核心的虛擬頁框。如果記憶體 I/O 允許超過 64GB,mem_map(分頁陣列)的大小會接近、甚至超過 Lowmem 的大小。如果發生這樣的情形,開機時可能就會發生 kernel panic。重新開機後,核心會無法分配核心記憶體,這樣一來又會發生 kernel panic 或當機。

  • 之前,如果使用者在「硬體虛擬化機器」(HVM,Hardware Vistualized Machine)連續按下方向鍵,會發生硬體中斷與計時器中斷的競爭情形。因此,鍵盤驅動程式會回報未知的鍵盤代碼事件。這項更新裡,i8042 計時器的調查功能已經被移除,這樣可以解決這項問題。

  • 有了這項更新,diskdump 工具程式(提供建立、蒐集 vmcore 核心傾印功能)現在支援 sata_svw 驅動程式。

  • 有了這項更新之後,「swap_token_timeout」參數已經加入 /proc/sys/vm

    這檔案包括置換出保護 token 時的合法延遲時間。Linux 虛擬記憶體(VM)子系統會根據 thrashing 控制機制建立一個 token,並使用這 token 來避免在 thrashing 過程中出現分頁錯誤。這個值的單位是「秒」,可以用來調整 thrashing 的行為。設為零的話,會停用這個置換 token 機制。

  • 之前當 NFSv4 用戶端在使用 readdir() 處理目錄時,會遇到問題,整個 readdir() 呼叫會被傳回來。這更新會在 readdir() 被呼叫時,設定 fattr4_rdattr_error 旗標,指示伺服器繼續,並只回報產生問題的目錄。

  • 之前 NFS 用戶端不會處理 readdir() 功能的錯誤回應。因此從伺服器而來的回應會指出呼叫 readdir() 成功,但這回應是空的。有了這更新之後,readdir() 的回應解析邏輯程式已經改變,這樣回應了錯誤格式時,用戶端會傳回 EIO 錯誤。

  • PRC 用戶端會把 portmap 呼叫的結果儲存在記憶體裡,在正確的環境下,這結果可以被釋放或移動。然而,在某些情況下,portmap 呼叫的結果會過早從記憶體釋放,這會導致記憶體內容損毀。這項更新會對 portmap 結果的記憶體位置新增參照計數器,只有在使用過後,才會將其釋放。

  • 在某些情況下,為 PRC 呼叫分配一些資料結構時,會因為系統記憶體不足而被阻擋,無法寫入。因此在記憶體需求甚鉅的環境下,會產生死結的問題,因為大量 NFS 分頁等著被寫入。有了這項更新,這些資料結構不會受到阻擋,這樣可解決問題。

  • 之前同步寫入 LVM 鏡射卷冊(使用 O_SYNC 旗標)時,效能會為之降低。因此,每次寫入 LVM 鏡射卷冊時會延遲 3ms(毫秒),導致鏡射卷冊的速度比線性卷冊慢五至十倍。有了這項更新後,I/O 佇列已加入 dm-raid1 驅動程式,鏡射卷冊的效能會有所改善,與線性卷冊並駕齊驅。

  • 新的微調參數可以讓系統管理者改變修改過的分頁 kupdate 每次執行時,寫入磁碟的最大數量。這參數(/proc/sys/vm/max_writeback_pages)的預設值是 1,024(4MB),因此每次執行 kupdate 時,最多會有 1,024 個分頁寫入。增加這個值會讓 kupdate 不斷將修改過的分頁移除,降低資料系統在 kupdate 執行之間資料遺失的可能性。然而,增加 max_writeback_pages 值可能會對效能造成影響。

  • /proc/sys/kernel/wake_balance 參數多了一個值。將 wake_balance 設為 2 會讓排程程式在任何可用的 CPU 上跑執行續,而不是用最佳的 CPU 來執行。這樣可以使用整台電腦的資源,降低整體延遲時間。

  • 在檢查目錄樹的時候,核心在某些情況下會不正確地認為該目錄樹並不忙碌。以掛載的檔案雖然處於開啟狀態下,但檔案處理程序覺得它並不處於忙碌情形下。這會導致系統向已掛載的目錄要求掛載。現在核心模組已經修正,不會再產生錯誤的掛載要求。

  • 在系統初始化時,CPU 製造商會在 APIC(Advanced Programmable Interrupt Controllers)初始之後才能偵測到。因此,八向的 x86_64 AMD 系統上,使用了 APIC 叢集模式的情形下,會導致系統效能降低。有了這更新後,CPU 製造商會在 APIC 初始化之前偵測到,讓 APIC 的實際模式作為預設模式啟用,這樣可以解決此問題。

  • Common Internet File System (CIFS) 程式碼已經更新,上游版本已修正數個錯誤,包括以下改變:

    之前,掛載沒有使用 Unix 延伸程式的伺服器時,可以改變檔案的模式。然而,這模式並不一定會永久儲存,許多檔案會回到原先的模式。現在這模式預設上不會讓檔案暫時改變模式;呼叫 chmod() 會傳回成功,但不會有任何效用。如果要使用舊的行為,必須使用新的掛載選項 dynperm

  • 之前在核心裡,dio_bio_end_aio()dio_await_one() 會有競爭關係。這可能會導致直接 I/O 存取會一直等待另一項已經完成的 I/O 程序。這項更新會鎖定運算,這樣發送與完成路徑會處於一致的狀態,藉以解決這個問題。

  • 之前從 Red Hat Enterprise Linux 4.6(安裝有 kmod-xenpv 套件)升級全虛擬客座系統到新版的 Red Hat Enterprise Linux 4 時,會導致內建核心模組間的不正確模組相依性關係:xen-vbd.ko & xen-vnif.ko 與舊版的 xen-platform-pci.ko 模組。所以,透過 xen-vbd.ko 區塊驅動程式掛載的檔案系統與使用xen-vnif.ko 網路驅動程式的客座端網路功能,都會失去作用。

    在 Red Hat Enterprise Linux 4.7 中,xen-platform-pci.ko 模組的功能市內建在核心中的。然而,當正式的可載入核心模組變成核心的一部分後,檢查現有可載入模組的相依性並不會正確執行。有了這項更新後,xen-platform-pci.ko 已經從內建核心中移除,放回可載入模組中,讓 module-init-tools 在更新核心時,檢查、建立正確的相依性關係。

  • 之前,在 64 位元主機上,使用半虛擬區塊驅動程式(xen-vbd.ko)在32 位元的 Red Hat Enterprise Linux 4.6 全虛擬客座端裡試圖掛載磁碟或分割區時,會出現失敗的現象。有著這更新之後,區塊的前端驅動程式(block.c)已經更新,它會通知區塊的後端驅動程式,客座端使用的是 32 位元的通訊協定,進而解決這項問題。

  • 之前,在全新電腦上的核心安裝 pv-on-hvm 驅動程式會建立 /proc/xen 目錄。應用程式會藉由這個目錄存在與否,判定系統是否使用了虛擬化核心;但這有誤判的可能。本次更新讓 pv-on-hvm 驅動程式不再建立 /proc/xen 目錄,可以解決誤判的問題。

  • 之前半虛擬客座端只能擁有 16 個磁碟裝置。這更新將最大值提升到 256 個磁碟裝置。

驅動程式更新

  • ALSA 中的 Intel® High Definition Audio (HDA) 驅動程式已經更新。這項更新支援更多更新的 HDA 整合音效之硬體。

  • 之前,使用 forcedeth 驅動程式的網路裝置會在多個用戶端執行 rcp 指令時,停止回應。有了這項更新後,forcedeth 驅動程式也隨之更新,解決了這問題。

  • 之前 sata_nv 驅動程式預設上會啟用 ADMA(Automatic Direct Memory Access)。因此,使用 sata_nv 驅動程式的裝置可能會遇到裝置錯誤與逾時問題。有了這個更新後,ADMA 模式在預設上會被停用,以解決這問題。

  • virtio(KVM 的 I/O 虛擬平台)的驅動程式已經從 Linux 2.6.27 核心匯入 Red Hat Enterprise Linux 4.8。這些驅動程式能讓 KVM 的用戶端享有更高等級的 I/O 效能。多種使用者元件,包括 anaconda, kudzu, lvm, selinuxmkinitrd 都已經更新,已支援 virtio 裝置。

  • r8169 驅動程式已經更新,提供對新的網路晶片之支援。有了這個更新後,RHEL 4.8 支援所有 RTL810x/RTL8168(9) 類型的晶片。

  • mptsas 驅動程式已經更新到 3.12.29.00。這更新包括了錯誤修正,並啟用以下新功能:

    • 支援雙連接埠。

    • SAS 晶片的電源管理。

  • lpfc 驅動程式已被更新為 8.0.16.46。此更新套用了多項修正和增強,包括:

    • 支援 FCoE LP21000 HBAs

    • 支援 HBAnyware 4.0

  • 給 SAS 為主的 RAID 控制器使用的 megaraid_sas 驅動程式已經更新到 4.01-RH1。這項更新修正了一些錯誤,也提供幾項改進:

    • 新增對 LSI Generation 2 Controllers (0078, 0079) 的支援

    • 新增指令,在關機過程中關閉 DCMD,改進關閉韌體的功能。

    • 之前有個問題會導致硬體 Linux 驅動程式的無預期中斷,這問題已經解決。

  • IBM eServer System PeHEA 乙太裝置驅動程式已經更新至 0078-08。

  • Red Hat Enterprise Linux 4.8 以上的 RHEL 4 版本,不再 EHCA infinband 裝置的驅動程式。

技術搶先版

Technology Preview 目前 無法 在 Red Hat Enterprise Linux 4.8 下支援訂閱服務,也許無法完整工作,並且不適用於生產。但由於這些功能是為了客戶的方便而存在的,並會在未來提供更廣泛的服務。

客戶或許會覺得這些功能適用於非生產環境下。我們誠摯歡迎客戶能夠提供回報以及相關技術搶先版的建議。勘誤機制將提供高服務的安全性功能。

在技術搶先版功能發展過程中,某些元件會提供開放測試。此為 Red Hat 在未來公告中能提供完整支援技術搶先版功能。

欲知更多 RHEL 技術搶先版的資訊,請參閱 Red Hat 網站:Technology Preview Features Support Scope

已解決的問題

  • 之前,如果 Red Hat Network 面板會用來將用戶重新註冊到不同的 Red Hat 衛星伺服器,這面板會繼續顯示舊伺服器上有的更新,即使這些更新不存在於新伺服器上。/etc/sysconfig/rhn/rhn-applet 並不會改變,以反映新伺服器的詳細資料。新的面板會根據伺服器網址與快取中的資料,提供更新資料,以確保能為使用者正確地顯示更新資料。這版本也能偵測設定檔的改變。如果偵測到改變的話,面板會自動重新載入設定變數,並建立新伺服器的連線。

  • sysreport.legacy 之前使用 $HOME 作為其 root 目錄。如果這變數不存在,或所參照的目錄無法寫入,sysreport.legacy 就無法產生其報告,而且會傳回 Cannot make temp dir 訊息後結束。Sysreport.legacy 現在會使用隨機建立的目錄,作為其 root 目錄,這樣一來就可以在不需要 $HOME 的情形下,產生報告。

  • automount daemon 使用固定的緩衝區大小 128 位元組,來接收 SIOCGIFCONF ioctl 的訊息,這訊息與本地介面測試特定掛載的主機之遠近有關。因為每個介面的詳細資料都是 40 位元組,daemon 只能收到不超過三個本地介面的資訊。如果有個主機所對應的掛載點有著本機的位址,但是沒有正確對應到這三個介面中的其中一個,那麼就會被判為不正確。

    automount daemon 現在會動態分配緩衝區,確保緩衝區足夠大到包含所有系統介面的資訊,這裡所指的系統介面是指能正確偵測 NFS 掛載的主機之介面。

  • Automount 會對應條目到掛載點的多台主機(重複掛載),automount daemon 會偵測遠端主機的清單,了解其遠近與 NFS 版本。如果主機無法回應,就會從清單中移除。如果遠端主機都沒有回應,這個清單就會變成空的。之前,daemon 在一開始的偵測後並不會檢查這清單是不是空的,這會導致錯誤(因為參照了 NULL 指標)。現在多了這項檢查,以避免問題。

  • ttfonts-zh_CN 套件之前包括了中易宋體(Zhong Yi Song)TrueType 字型。本字型的版權屬於北京中易中標電子信息技術有限公司,並授權給 Red Hat Inc. 以 Red Hat 之名,給 Red Hat 的產品與軟體使用。將這字型納入會讓 Red Hat 無法自由散佈此套件。但中易宋體還是可以透過 Red Hat Network 與補充光碟,以 fonts-chinese-zysong 套件之名給 Red Hat 的用戶使用。

  • 當 multipath 設定了 1,024 條以上的路徑時,multipathd 會當掉,訊息為 multipathd dead but pid file exists,這是因為它無法為每個路徑開啟檔案。這可能會導致 error calling out /sbin/mpath_prio_ontop /dev/[device] 錯誤。現在,新的 multipath.conf 參數與 max_fds 能讓使用者設定檔案描述子的最大數目,表示 multipathd 能開啟的數量,或使用 max 來設定系統最大值的數量。請將 max 設定到夠高的數量,或使用 max 來避免 multipathd 當掉。

  • 之前,在 Adaptec 2120SAdaptec 2200S 控制器使用 accraid 驅動程式時,系統可能會無法開機,傳回錯誤訊息:aac_srb:aac_fib_send failed with status 8195accraid 驅動程式已經更新,進而解決這項問題。

  • SOS 是可以蒐集系統硬體與現有設定的工具組。這些資訊可以用來診斷問題與偵錯。

    這次更新中,sosreport 所產生的報告包括五種資訊,是之前沒有的:

    • /var/log/cron* 以及 crontab -l 的內容,顯示問題發生時,系統正在執行什麼。

    • parted 蒐集而來的分割區資訊,而不是之前的 fsidk,因為前者可以取得後者無法取得的資訊,例如 GUID 分割區。

    • dumpe2fs -l 的執行結果。

    • /etc/inittab 的內容。

    • /sbin/service --status-all 的執行結果,顯示服務的現有狀態。之前,只有開機時的服務設定會被蒐集(從 chkconfig --list 而來)。

  • automount 使用 umount(8) 來處理過期的掛載,umount(8) 可能會無限期的等待伺服器回應。這可能會導致該過期的被阻絕,進而導致在同一個 /usr/sbin/automount 程序(也就是某個特定 automount 程序所管理的掛載)內的掛載無法過期。這樣一來,如果伺服器停止服務,那麼 automount 就不會卸載任何過期的掛載點,即使伺服器已經停止回應。這樣系統就會有許多該過期而未過期的掛載。automount 現在包括一個命令列選項,指定 automount 在放棄、並移到其他掛載之前,所要等待的時間。這樣過期的掛載就可以被卸載,即使一些伺服器已經停止回應。

  • netpbm 套件已經更新,已修正以下問題:
    • netpbm 的一些工具程式並不會從標準輸入接受檔案,即使這方法在文件中有記載。這問題現在已經解決。

    • netpbm 的一些工具程式會在製作映像檔案時當掉。這問題已經解決。

  • ICQ 伺服器最近有所更動,需要使用者使用新版的 ICQ 通訊協定。用 Pidgin 2.5.2(之前 RHEL 4 所提供的版本)登入 ICQ 會失敗。現在 Pidgin 已經更新到 2.5.5,解決了這個問題。

  • 之前 RHEL4 記載光纖通道重新掃描的 Red Hat 知識庫的內容有誤。正確過程已經更新,可以在 http://kbase.redhat.com/faq/docs/DOC-3942 找到。

  • 成功連上 SSH 伺服器之後,伺服器可能會傳回文字說明給用戶端。因此,如果 gftp(圖形介面的 ftp 用戶端程式)試圖透過 SFTP 連線到 SSH 伺服器上,而伺服器又傳回文字說明,gftp 會將這文字說明判為錯誤,並關閉連線。現在 gftp 已經更新到 2.0.18,允許連線到這類伺服器。

  • 上傳單一檔案到 NFS 目錄時,顯示修改與存取時間的時間戳記可能會不正確。現在時間戳記會正確更新。

  • kudzu 偵測 PCI 裝置的原始碼無法正確找到一些綁定特定 PCI 類別的模組,特別是 SGI Altix 系統的 sgiioc4 驅動程式。沒有載入這些模組的話,系統就不會偵測到相依於這驅動程式的裝置。新版的偵測原始碼已經包含在這更新過的套件中,它可以成功地找到這些受影響的模組。

已知問題

  • RHEL 4.8 的邏輯卷冊管理員會回報檔案描述子的漏洞,導致安裝結果出現以下錯誤訊息:

    File descriptor NUM (socket:XXXX) leaked on lvm invocation.
                                            

    您可以忽略這訊息。

  • 透過 NFS 安裝 RHEL 4 時,安裝程式會無法正確地關閉 NFS 掛載點。這可能會導致 NFS 伺服器運作不正常。在這情形下,Red Hat 建議您使用 HTTP 伺服器來進行安裝。

  • 在支援舊式(acpiphp)與原生(pciehp)PCI 熱插拔功能的 BIOS 上,管理者需要選擇偏好設定,並避免 Red Hat Enterprise Linux 4 載入不需要的模組。方法是把不想要的模組放到 /etc/modprobe.conf 的黑名單裡。

  • 經過了 Mellanox MT25204 的硬體測試後,我們發現在某些特定的高負載情況下,有項內部錯誤會產生。當 ib_mthca 驅動程式針對於此硬體回報了重大錯誤時,這一般會和用戶應用程式所產生的未完成工作請求相關的佇列深度完成度不足有關係。

    雖然驅動程式會將硬體重新啟動並由此事件復原,不過錯誤發生時的所有連線都會失去。這一般會變成一項用戶應用程式中的區段錯誤。另外,若錯誤發生時 opensm 正在執行的話,那麼您將需要手動式地將它重新啟動,這樣一來您才可恢復至正常的作業。

  • 在先前版本的 openmpilam 有項錯誤會讓您無法升級這些套件。這項錯誤可能也會造成您無法成功使用 up2date 來升級所有套件。

    此問題清楚地顯示於下列當嘗試升級 openmpilam 時所產生的錯誤中:

    error: %preun(openmpi-[version]) scriptlet failed, exit status 2
                                    

    此問題也清楚地顯示於下列當嘗試透過 up2date 來升級所有套件時所產生的錯誤中(記錄於 /var/log/up2date 之中):

    up2date Failed running rpm transaction - %pre %pro failure ?.
                                    

    因此,您首先需要手動式地移除舊版的 openmpilam 才可避開這些錯誤。若要如此,請使用以下的 rpm 指令:

    rpm -qa | grep '^openmpi-\|^lam-' | xargs rpm -e --noscripts --allmatches

  • 當有個 LUN 由一部已配置的儲存系統上移除時,此變更不會反映在主機上。在此情況下,當使用了 dm-multipath 時,lvm 指令會不定時地擱置住,因為 LUN 的狀態已成為 stale(失效)了。

    欲解決此問題,請將 /etc/lvm/.cache 中所有失效的 LUN 特屬的裝置和 mpath 連結項目刪除掉。若要找出這些項目為何,請執行下列指令:

    ls -l /dev/mpath | grep <stale LUN>

    比方說,若 <stale LUN> 為 3600d0230003414f30000203a7bc41a00 的話,下列結果就會出現:

    lrwxrwxrwx 1 root root 7 Aug  2 10:33 /3600d0230003414f30000203a7bc41a00 -> ../dm-4
    lrwxrwx--rwx 1 root root 7 Aug  2 10:33 /3600d0230003414f30000203a7bc41a00p1 -> ../dm-5
                                    

    這代表 3600d0230003414f30000203a7bc41a00 會被映對至兩個 mpath 連結:dm-4dm-5

    因此,下列行列應由 /etc/lvm/.cache 中刪除掉:

    /dev/dm-4 
    /dev/dm-5 
    /dev/mapper/3600d0230003414f30000203a7bc41a00
    /dev/mapper/3600d0230003414f30000203a7bc41a00p1
    /dev/mpath/3600d0230003414f30000203a7bc41a00
    /dev/mpath/3600d0230003414f30000203a7bc41a00p1
                                    
  • 在一個 HA-RAID two-system 的配置中,兩個 SAS 控制介面會被插入兩部系統中並連至一個共享的 SAS disk drawer。將這兩個 SAS 控制介面的 Preferred Dual Adapter State 屬性設為 Primary 將會產生 race 狀態並造成這兩個 SAS 控制介面產生無止境的 failover。這是因為只有一個 SAS 控制介面可被設為 Primary

    若要避免此錯誤發生,請確認如果其中一個 SAS 控制介面的 Preferred Dual Adapter State 被設為 Primary 的話,另一個 SAS 控制介面就必須設為 None

  • 若您需要使用 hp_sw kernel 模組的話,請安裝已更新的 device-mapper-multipath 套件。

    您也需要正確地配置 HP 陣列以便正確地使用 active / passive 模式並可辨識來自於一部 Linux 機器的連線。若要如此,請執行下列步驟:

    1. 請透過使用 show connections 來判斷各個連線所使用的 WWPN(world wide port name)為何。下列為一個在含有兩個連線的 HP MSA1000 陣列上的 show connections 的範例輸出:

      Connection Name: <Unknown>
      Host WWNN = 200100E0-8B3C0A65
      Host WWPN = 210100E0-8B3C0A65
      Profile Name = Default
      Unit Offset = 0
      Controller 2 Port 1 Status = Online
      
      Connection Name: <Unknown>
      Host WWNN = 200000E0-8B1C0A65
      Host WWPN = 210000E0-8B1C0A65
      Profile Name = Default
      Unit Offset = 0
      Controller 1 Port 1 Status = Online
                                                      
    2. 請透過執行以下指令來正確地配置所有連線:

      add connection [connection name] WWPN=[WWPN ID] profile=Linux OFFSET=[unit offset]

      請注意 [connection name] 可任意設置。

      根據範例,正確的指令應該是:

      add connection foo-p2 WWPN=210000E0-8B1C0A65 profile=Linux OFFSET=0

      add connection foo-p1 WWPN=210100E0-8B3C0A65 profile=Linux OFFSET=0

    3. 請再次執行 show connections 來驗證所有連線都已正確配置。根據提供的範例,正確的配置應該是:

      Connection Name: foo-p2
      Host WWNN = 200000E0-8B1C0A65
      Host WWPN = 210000E0-8B1C0A65
      Profile Name = Linux
      Unit Offset = 0
      Controller 1 Port 1 Status = Online
      
      Connection Name: foo-p1
      Host WWNN = 200100E0-8B3C0A65
      Host WWPN = 210100E0-8B3C0A65
      Profile Name = Linux
      Unit Offset = 0
      Controller 2 Port 1 Status = Online
                                                      
  • Red Hat 不建議您在 EXT3 檔案系統上使用 quota。這是因為在某些情況下,這麼做會造成死鎖(deadlock)產生。

    經過測試,我們發現當 quota 正在執行時,kjournald 有時會將一些 EXT3 特屬的 callout 阻擋住。Red Hat 並不計畫在 Red Hat Enterprise Linux 4 中修正此問題,因為所需進行的修改太具侵略性。

    此問題在 Red Hat Enterprise Linux 5 中並不存在。

  • 經過了 Mellanox MT25204 的硬體測試後,我們發現在某些特定的高負載情況下,有項內部錯誤會產生。當 ib_mthca 驅動程式針對於此硬體回報了重大錯誤時,這一般會和用戶應用程式所產生的未完成工作請求相關的佇列深度完成度不足有關係。

    雖然驅動程式會將硬體重新啟動並由此事件復原,不過錯誤發生時的所有連線都會失去。這一般會變成一項用戶應用程式中的區段錯誤。另外,若錯誤發生時 opensm 正在執行的話,那麼您將需要手動將其重新啟動,這樣一來才可恢復正常作業。

  • 您可透過點選桌面共享(Desktop Sharing)連線的圖像兩下來顯示它的選單,而不是按下滑鼠右鍵。所有其它的圖示則需要按下右鍵才可顯示它們的選單。

  • 如果 ib_ehca InfiniBand 驅動程式已經以連接埠自動偵測模式載入(使用模組參數 nr_ports=-1),那麼 IP-over-InfiniBand 網路介面(ibX)可能會太晚才能使用。當發生這種情形時,從 openibd 啟動程序檔所發出的 ifup ibX 指令會失敗;因此 ibX 介面就無法使用。

    當發生這種情形時,使用 rcnetwork restart 來修正這錯誤。

  • IBM Redbook "Implementing InfiniBand in IBM System p (SG247351) 裡,表格 6-3(PDF 檔的第 220 頁)描述了 debug 用的位元定義,其中數個 HCA 錯誤指示位元也有所涉獵。

    請注意,eHCA2 介面的第 46 與 47 個位元可能會傳回錯誤的正數。

  • HP ICH10 工作站上,聲音只能透過前端的 3.5mm 接頭發聲。因此,要聽到任何聲音或使用錄音功能,請將耳機、喇叭、或麥克風連到前端端子上。目前這台工作站的後端端子、內部喇叭、以及主音量都無法運作。

  • 使用這項更新後,以下型號的預設的 PCI 偵測與排列方法有所改變:

    • HP Proliant DL 580 G5

    • HP Proliant DL 385 G2

    • HP Proliant DL 585 G2

    這些模組使用裝置掃描與列舉模式,但卻不是 RHEL 4 或 5 的預設作法。這些 HP Proliant 型號會導致偵測到新加入的介面卡之後,順序放在主機板內建與內部裝置的前面。這無預期的排序方式會讓安裝 RHEL、新增硬體、與維護更加困難。

    更新 RHEL 4.7 的核心之後,前述 HP Proliant 型號的網路卡順序可能會改變。如果每張網路卡在 /etc/sysconfig/network-scripts/ifcfg-eth[X] 檔案裡的 HWADDR=MAC ADDRESS 參數並沒有定義,安裝程式會改變網路卡的順序。因此,Red Hat 建議您定義這項參數,以避免未預期的網路卡列舉方式,所可能造成的問題。

    除此之外,在 Red Hat Enterprise Linux 4.7 裡,要避免更新這些 HP Proliant 型號的任何網路卡列舉的改變,請將核心參數 pci=nobfsort 加入至 /boot/grub/grub.conf

  • 當邏輯群組包含了鏡射或 snapshot 時,執行 lvchangd 指令加上邏輯群組選項,可能會導致以下錯誤訊息:

    Unable to change mirror log LV fail_secondary_mlog directly
    Unable to change mirror image LV fail_secondary_mimage_0 directly
    Unable to change mirror image LV fail_secondary_mimage_1 directly
                                            

    您可以安心忽略這訊息。

  • Dell PowerEdge SC1435s 開機時可能會當機。要避免這問題,請編輯 grub.confterminal 一行,將 serial console 取代為 console serial

  • 更新過的 ixgbe 並不支援 Intel 82598ATCopper Pond 10GbE)。

  • Red Hat Enterprise Linux 5.3 可以線上偵測區塊裝置增大或變小。然而,目前沒有方法可以自動偵測裝置的大小是否改變,因此要知道這些裝置上的檔案系統之大小是否改變,需要手動步驟。當偵測到區塊裝置的大小改變時,系統日誌會出現類似以下的訊息:

    VFS: busy inodes on changed media or resized disk sdi
                                    

    如果區塊裝置增大,那麼您可以忽略這訊息。然而,如果區塊裝置變小,但是在那之前沒有讓上面的資料量變小,那麼資料可能會損毀。

    只有在整個 LUN(或區塊裝置)上建立的檔案系統,才有可能線上調整大小。如果有個分割區位在區塊裝置上,檔案系統就必須先卸載,以更新這分割表。

  • res_n* 家族(例如 res_nqueryres_nsearchres_nmkquery)有個已知的記憶體泄露(memory leak)問題。使用這些函數的程式會持續發生記憶體泄露的問題。新版的 glibc 已經解決了這個問題;然而,這修正方法對於 Red Hat Enterprise Linux 4 來說,太具侵略性。使用這些函數的程式可能偶爾需要重新啟動,以釋放記憶體。

  • 安裝 Red Hat Enterprise Linux 4 時,系統可處理的裝置數目與 initrd 映像檔有關。因此,如果一台機器上連接了太多裝置(例如許多光纖通道),那麼除非降低裝置數目,否則安裝不可能繼續進行。

  • aacraid 驅動程式更新首見於 Red Hat Enterprise Linux 4.7,需要最新的 Adaptec PERC4/Di 韌體。之後的 Red Hat Enterprise Linux 4(包括 4.8)需要 PERC3/Di 韌體版本 2.8.1.7692, A13 以上。您可以在此找到此韌體:

    http://support.dell.com/support/downloads/download.aspx?c=us&cs=555&l=en&s=biz&releaseid=R168387&SystemID=PWE_PNT_PIII_1650&servicetag=&os=WNET&osl=en&deviceid=1375&devlib=0&typecnt=0&vercnt=9&catid=-1&impid=-1&formatcnt=4&libid=35&fileid=228550

  • 安裝過程中,anaconda 可能不會移除之前系統留下的所有邏輯卷冊管理員(LVM)metadata。這些額外的 metadata 可能會導致安裝後,LVM 工具回報卷冊群組或邏輯卷冊不見了。要解決這問題,在安裝完成之後,移除 LVM 的舊 metadata。

  • multipath 會印出其呼叫的程式之錯誤訊息。因此,如果 multipath 在路徑失去效用時執行,就會顯示多種錯誤訊息,訊息內容端視 multipath 使用的程式而定。舉例來說,如果 multipath 執行時,失去效用的是 scsi 裝置,那麼 scsi_id 就會印出

    <H>:<B>:<T>:<L>:Unable to get INQUIRY vpd 1 page 0x0.
    <H>:<B>:<T>:<L>:sg_io failed status 0x0 0x1 0x0 0x0
                                            

    如果 multipath 執行時,失去效用的是 EMC CLARiiONmpath_prio_emc priority 就會印出 query command indicates error

( amd64 )

Provided by: Nexcess.net