私は、入社22年目で、現在、技術部新横浜エンジニアリングセンター第1技術グループに在籍し(某電気メーカーの)自動運転プロジェクト案件の請負業務をしている長塚と申します。
今日は、以前に担当した通信機サーバーについてお話します。
設計確認と信頼性試験
2000年頃の案件で、当時の私は設計にはあまり携わっていませんでしたが、担当としては設計確認と信頼性試験をしていました。
設計確認というのは、試作機を使用して設計仕様通りに動作することを確認し、正常な動作をしていない場合はエラー原因の解析、検証及び対策実施を行う業務です。
また、信頼性試験では、試作機を使用して様々な環境試験、具体的には「雷サージ試験、静電気印加試験など」の装置が使われる環境を再現し、問題が無いか設計確認し、エラー(異常)発生時は、原因の解析、検証及び対策実施を行っていました。
装置が止まってしまう現象が・・
この時に一番苦労したことは、設計確認におけるエラー発生した際の原因解析、検証及び対策でした。
この時のエラーとは、通信機サーバーが通常の運用状態の中、あるタイミングにおいて異常を検知して装置が停止してしまうという現象でした。
エラーの詳細は、CPUが外部メモリにリードアクセスした際にデータ異常を検出し停止してしまっていたという内容であった為、発生原因として波形品質若しくはタイミング異常を疑い、CPUから外部メモリにアクセスする波形及びアクセスタイミングを確認してみたのですが、どちらにも異常は見られませんでした。
その後、いろいろな原因を推測して解析、検証を実施したのですが解らず、当時一緒にやっていた方にもいろいろな見解を頂き解析を実施したのですが、結局のところデータ異常の原因は解りませんでした。
ついに原因究明!
そこで、デバイスメーカーに問い合わせを行った結果、「CPUの電源ノイズが怪しいのでは」との回答を得た為、CPUの電源ノイズを確認したところ、若干ではありましたがCPUのスペックをオーバーしていることが判りました。
その対策としてCPUの電源にノイズ低減用のコンデンサを追加した結果、ノイズを減少させることができ、エラーが発生しなくなりました。正直かなり苦労しました。
結局、原因がわかるまでに約3か月程度かかってしまったのですが、このように長い時間をかけ、いろいろな検証及び評価を実施しても、エラー原因がわからなくメーカー等に問い合わせして初めて原因がわかるということも少なからずあります。
ですが、対策を実施した結果、エラーが発生しなくなり装置が正常に動作した時には、それまで苦労してきたことを吹き飛ばす位の達成感を味わうことができます。
今回のように、自分自身でエラー原因を発見し、対策を実施した結果が良かった時などが、エンジニアをやっていて良かったと感じる瞬間ですね。
By nagatsuka
◇◆◇◆ お知らせ ◇◆◇◆
当社では、物づくりの体験と当社の事がわかる“体感型”会社説明会を開催しております。
物づくりに興味のある方、セントラルエンジニアリングに興味のある方は、是非、
“体感型”会社説明会に、ご参加ください。
また、遠方に在住の方や日程が合わず説明会に参加するのが難しい方向けに、
“WEB会社説明会”と“WEB面接”をご用意しております。