ChamberPlus System Level Studio: 我的 ARM--- STM32 故事 (一) ：開發學習版的 UART

2020年7月29日星期三

我的 ARM--- STM32 故事 (一) ：開發學習版的 UART

如果我不來寫點 32 Bits MCU 的話，人家還真的以為我是LKK 工程師，

或是認為我獨鍾 8 bits MCU 而排斥 32 bits MCU 呢。

但說坦白話，搞 32 bits MCU 就比較有出路或比較容易賺到錢嗎？見仁見智吧！

這還是要看你對於產品市場的定義吧。那如果從技術觀點呢？那也不一定。

我的硬體師傅(就是我的PCB Layout 啟蒙老師)，他最近因為大陸疫情關係，

暫時就回台灣待一陣子，他就跟我說：他之前在大陸就碰到一個案子：LED 燈控，

用STM32 跑 170 幾MHz ，結果碰到中斷，發現：STM32 也沒比較厲害...

至於我為什麼比較少寫 32 bits MCU 的故事？因為我覺得這些東西基本上跟

一般 8 bits MCU 的基礎觀念是差不多的，那你說：不一樣啊，效能或資源比較多啊。

但說效能或資源比較多，那乾脆就透過USB 把工作丟到PC 端不是更好嗎？

人家現在還標榜"雲端運算"，那不是更好嗎？所以說啊，這種事誰說得準？

我就舉一個以前我自己碰過的故事：

下圖是我在 IC 設計業的第一個SOC 產品：Scanner SOC 。

大家可以看到他內部有 8 KBytes MCU 跑程式的 Cache Memory，另外還有影像處理

的資料記憶體： 16 KBytes。其實大家都知道：記憶體在 IC 內部是最佔空間的，

也是IC 成本的最大殺手。所以這個資料記憶體能越小就越好。

如果大家不清楚整顆SOC 的架構或資料流程的話，我就用另一張圖給大家參考：

當然啊，我們這一代的SOC 算是很成功的，因為我們在系統上根本不用在外掛任何

記憶體緩衝區，真的只靠一顆SOC 就搞定掃描器的產品開發，頂多就是外掛一顆

步進馬達驅動IC 就可以了。

那為什麼是 16 KBytes 的記憶體緩衝區？因為當初掃描器能做到 600 DPI 就不得了了，

就算是 1200 DPI 的，也是用 600 DPI 的影像RAW data 內插出來的。

所以我們算一下：600 點 x RGB = 1800 Bytes 資料，一般步進馬達會不斷的掃描影像

將影像資料透過USB 上傳給影像處理軟體做影像處理。但如果上層處理速度不夠的話，

步進馬達會暫時停下來，然後會稍微在倒退一點重新讀取幾條線，讓影像連結平滑

一點，所以只要這中間的資料傳輸有點任何耽誤的話，就容易造成掃描停頓問題。

但那時候USB 1.1 剛出來，他的傳輸速度遠超過傳統的串列或並列(EPP)的傳輸效能。

所以我們認為這樣子的資料緩衝區就夠了。

---

但到了第二代的產品規格討論時，我們內部就發生了規格上的嚴重意見爭執，

我的主管主張：因為電腦效能與USB 介面的傳輸速率會越來越快，所以內部

記憶體緩衝區不但不用增加還可以減少；但另一派的看法認為：反正市場出現

2400 DPI 需求，而外掛 DRAM 當緩衝區，可以直接拿掉SOC 內部的記憶體緩衝區，

直接降低IC 成本，但這一點我主管認為只是把IC 成本轉嫁系統成本給客戶，

(因為系統板子上除了我們的IC 之外，還要再加一顆DRAM...)。他不是那麼苟同。

但最後結論是我主管敗下陣來。(當然還有其他因素，他就離職了。)

而我呢？為了避免捲進風波...適逢公司被園區大型IC 設計公司合併，我就選擇請調

到該公司的另一部門。那另一派就以他們外掛DRAM 方式進行新一代SOC 開發，

當然啊，在IC 設計團隊強勢主導下，而系統應用不強的情形下，TAPE-OUT 幾顆之後，

這個產品線的計畫就全面中止了。這沒有誰對？誰錯？的問題。這在許多公司都很

常見的故事。

----

所以這個故事告訴我們：有很多產品開發的技術規格問題，不能光只靠單一角度或

某種觀點就可以了，有很多方面除了硬體本身效能問題之外，還有許多外在系統

調教平台觀念建立的。經歷這一件事也讓我真正的學習到產品開發過程中，

不是一拿到解決方案就矇著頭一路拼命的往下走，有些東西還是有一些理論分析

工作可以事先評估計算的...尤其是你將來也會成為技術主管，也是要會看規格，

開規格，也會像我主管那般的專業判斷能力的。

所以針對 32 bits MCU 的系統應用，我就比較會冷靜的用系統觀點來評估的。

沒有凡事都得人云亦云，就算要用也要懂得拿捏使用條件與環境。

只是因為現在 32 bits MCU ，尤其是這一顆 STM32 MCU，幾乎淹沒所有國內外

技術論壇，所以有時真的沒差我一個人來幫他寫甚麼專業技術的開箱文的...

所以就算我自己私底下在用，我也沒有多大的興致提筆寫寫關於他與我的故事。

剛好我最近也算比較有多一點自己閒暇時間，我就可以拿來玩玩寫寫東西了。

---

最近有朋友請我用 STM32 幫他看一下產品開發的技術問題，所以我就拿出

這一片已經買了一陣子(2018/07) 的學習開發版出來玩一下：

結果我發現他串口除錯是用大陸的 CH340 。我當然知道這一顆UART 轉USB 的IC。

只是在網路上也有一些負評。當我架起來玩不到幾分鐘就覺得哪邊怪怪的...

說真的，我也懶得幫這些IC 廠 Debug，也不想讓這一種鳥事耽誤自己的青春。

所以我就直接外接另一片以 CP210X 的模組取代原來開發版上的CH340。

結果一試就OK 了。

我是覺得網路上有很多人在糾結這樣的故事，哎啊...這個東西有甚麼問題啊？

到處請教專家？或到各個粉絲團或論壇提問....

花了很大的功夫只是為了只證明一件事：原來這些 Cost Down 的東西問題那麼多喔？

原來大家所講的是真的喔。怎樣？幫這些IC 找Bug 有獎品或獎金嗎？

學習過程固然是一種技術養成的訓練，但有些時候也是要看一下甚麼情況啊。

就像我上述的那個掃描器SOC 的規格爭論問題一樣，有些東西也是可以事先評估算計的，

而不是凡事都是矇著頭一路蠻幹的....不只是技術觀點，有些就是技術以外的觀念也是

要有的。這是一個小小的經驗分享。

23 則留言:

Bee2020年7月31日上午10:56
個人是可以少用中斷就少用。以STM32 UART為例，我幾乎完全沒有中斷(除了錯誤檢知)，就可以收發資料。
後來有人做案子找我要UART程式碼,我才覺得奇怪，原來是要我寫的無中斷收發寫法。遇到同版主問題，中斷影響到主要效能，問我是如何解。我就單純使用DMA，將資料堆入RAM，有空才去解析。
在大陸論壇上目前看來仍是青一色用中斷，不管用那個都不能解決問題。
回覆刪除
回覆
Bee2020年7月31日上午11:02
http://wallace7914032.blogspot.com/2014/12/dmafifo.html
以上是個人解法，找出來給您參考。若是用HAL函式庫，就要自己去暫存器設定。
回覆刪除
回覆
Bee2020年7月31日上午11:32
STM32的中斷慢，也不是現在的事。我一拿到STM32公司就要我安裝公司用的SPI及I2C驅動，我才覺得奇怪，MCU不是硬體已有，那程式是做什麼，好奇打開一看，天啊!是GPIO模擬的SPI及I2C。我回頭問，裝這怎用?結果真的是用GPIO，公司還說可以用在所有的MCU上。我沒裝，直接用MCU上的，再加上DMA。後來GPIO模擬的遇到新IC就出問題了,我就沒有事。
有時就覺得時代上來了，差不多成熟，還是用上去。有些則是太早的技術，會等它成熟些。
回覆刪除
回覆
Bee2020年8月3日下午2:05
誤解是從clock上來看的，STM32花的clock數目多，很多人就不接受。認為STM32跑個200Mhz，IO翻轉率也要跟上來，你以為翻IO不用電?翻得快，電也用得多，為了省電IO的clock就降速。最後速度變得只比8051的時間好一些些，然後STM32有6組uart,3組spi,2組i2C,若是全部用中斷11組通信埠都在中斷來中斷去，效率會好?
我問過很多工程師,中斷這樣多，不會變慢?清一色回答,是晶片商的事。最後倒楣的會是專案經理，一下這不穩或是效率不好等等。
DMA用在通信上是以封包為單位，就是輸出時要告知多少字元要出，出完了才給中斷。中斷使用率比沒有用DMA的少了至少有十倍，接收也差不多。
以前一個字元就會收到,然後要寫處理程式。現在DMA則是一次收一包，用字串方式處理，程式結構不太一樣，有些工程師就是不想改字元處理為字串處理，就不想用DMA。
許多問題是習慣性而不是技術性，工程師就推說是廠商問題，於是才會有中斷比較慢這個傳說。

複雜的處理器，更考驗工程師的功力。但一般人會以為"更好的處理器，會得到更好的功能"。
這就是現實和認知的落差。
回覆刪除
回覆

新增留言

訂閱：張貼留言 (Atom)

訂閱

2020年7月29日 星期三

我的 ARM--- STM32 故事 (一) ：開發學習版的 UART

23 則留言:

2020年7月29日星期三