日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式微處理器
[導(dǎo)讀]來源 :CSDN 就目前而言,在編程領(lǐng)域中,C語言的運用非常之多,它兼顧了高級語言的匯編語言的優(yōu)點,相較于其它編程語言具有較大優(yōu)勢。 在所有標(biāo)準(zhǔn)C語言頭文件中聲明的字符串處理函數(shù)中,最常用的是那些用來復(fù)制和連接字符串的函數(shù)。這兩組函數(shù)都將

來源 :CSDN

就目前而言,在編程領(lǐng)域中,C語言的運用非常之多,它兼顧了高級語言的匯編語言的優(yōu)點,相較于其它編程語言具有較大優(yōu)勢。

在所有標(biāo)準(zhǔn)C語言<string.h>頭文件中聲明的字符串處理函數(shù)中,最常用的是那些用來復(fù)制和連接字符串的函數(shù)。這兩組函數(shù)都將字符從一個對象復(fù)制到另一個對象,并且都返回它們的第一個參數(shù):指向目標(biāo)對象的起始指針。這種返回值的方式是導(dǎo)致函數(shù)效率低下的一個原因,而這正是本文要探討的主題。
本文中展示的示例代碼僅僅用于說明目的。它們可能包含細(xì)微的錯誤,不應(yīng)該被視為最佳代碼實踐。

01
標(biāo)準(zhǔn)解決方案


這種返回函數(shù)的第一個參數(shù)的設(shè)計,有時候會被不明白其用途的用戶所質(zhì)疑。這樣的例子在StackOverflow網(wǎng)站上有不少,例如關(guān)于strcpy()返回值,或者C語言的strcpy為什么返回它的參數(shù)?的討論。簡單的答案是,這是一個歷史性的意外。函數(shù)的第一個子集是由Unix第七版在1979年引入的,它由strcat、strncat、strcpy和strncpy函數(shù)組成。盡管這四個函數(shù)都在Unix的各種版本中使用,但通常情況下,對這些函數(shù)的調(diào)用卻沒有使用它們的返回值。盡管這些函數(shù)可以同樣很容易地定義為返回一個指針來指向最后一個復(fù)制的字符(或它的后一位),而且事實證明這種做法也非常有用。
兩個或多個字符串的連接操作的最佳復(fù)雜度和字符數(shù)量成線性關(guān)系。但是,如上所述,讓函數(shù)返回指向目標(biāo)字符串的指針會導(dǎo)致操作的效率明顯低于最佳效率。該函數(shù)遍歷源字符串序列和目標(biāo)字符串序列,并獲取指向這兩個序列末尾的指針。該指針指向函數(shù)(strncpy除外)附加到目標(biāo)序列上的字符串結(jié)束符NUL('\0')處或它的后一位。但是,如果返回的指針指向第一個字符而不是最后一個字符(或它的下一個字符),NUL結(jié)束符的位置會丟失,必須在需要時重新計算。這種做法的低效率可以在將兩個字符串s1和s2連接到目標(biāo)緩沖區(qū)d中的示例中得到說明。將一個字符串添加到另一個字符串的慣用方法(雖然遠(yuǎn)非理想)是調(diào)用strcpy和strcat函數(shù),如下所示:
    
strcat ( strcpy (d, s1), s2);
為了執(zhí)行這個連接操作,除了同時發(fā)生的相應(yīng)地在d上的傳遞之外,一次在s1的傳遞和一次在s2上的傳遞是必須要執(zhí)行的操作,但是上面的調(diào)用在s1上進(jìn)行了兩次傳遞。讓我們把這些調(diào)用分成兩個語句。      
    
char *d1 =  strcpy (d, s1);  // pass 1 over s1
         strcat (d1, s2);  // pass 2 over the copy of s1 in d
因為strcpy返回其第一個參數(shù)d的值,所以d1的值與d相同。為簡單起見,在后面的示例中我們將使用d,而不是將返回值存儲在d1中并使用它。在strcat調(diào)用中,我們遍歷剛剛復(fù)制到d1的字符串以確定最后一個字符的位置,這個成本和第一個字符串s1的長度是線性關(guān)系。這個成本乘以每個要連接的字符串。因而最終整個連接操作的成本相當(dāng)于連接數(shù)和所以字符串長度的乘積,趨于一種二次方的關(guān)系。這種低效率是如此的臭名昭著,以至于為自己贏得了一個名字:畫師施萊米爾算法。(另見http://www.open- std.org/jtc1/sc22/wg14/www/docs/n2349.htm#sad-string)
必須指出的是,除了效率低 下之外,strcat和strcpy還因其緩沖區(qū)溢出的問題而臭名昭著,因為它們都對復(fù)制字符的數(shù)量不做任何限制。

02
克服局限性的嘗試


當(dāng)源字符串的長度未知且目標(biāo)字符串大小固定時,遵循一些流行的安全編碼準(zhǔn)則來將連接結(jié)果限制為目標(biāo)區(qū)大小實際上會導(dǎo)致兩個冗余的傳遞。例如,按照CERT關(guān)于安全使用strncpy()和strncat() 的建議,并且目標(biāo)區(qū)的大小是dsize字節(jié),我們可能會得到以下代碼。
    
strncpy (d, s1, dsize -  1);       // pass 1 over s1 plus over d up to dsize - 1
    d[dsize -  1] =  '\0';              // remember to nul-terminate
     size_t n =  strlen (d);            // pass 2 over copy of s1 in d
     strncat (d, s2, dsize - n -  1);   // pass 3 over copy of s1 in d
注意,與對strncat的調(diào)用不同,當(dāng)s1的長度大于d的大小時,上面對strncpy的調(diào)用不會將NUL('\0')結(jié)束符追加到d上。 它是一個常見的想當(dāng)然的錯誤。 此外,當(dāng)s1短于dsize-1時,strncpy函數(shù)將所有剩余的 字符填滿為NUL('\0'),這也被視為一種浪費的,因為隨后對strncat的調(diào)用將覆蓋掉它 們。
為了避免一些冗余,程序員有時會選擇先計算字符串長度,然后使用memcpy,如下所示。這種方法仍然效率不高,而且更容易出錯,并且代碼難以閱讀和維護(hù)。
    
size_t s1len =  strlen (s1);       // pass 1 over s1
     if (dsize <= s1len)
          s1len = dsize -  1;             // no need to nul-terminate
     memcpy (d, s1, s1len);            // pass 2 over s1
     size_t s2len =  strlen (s2);       // pass 1 over s2
     if (dsize - s1len <= s2len)
          s2len = dsize - s1len -  1;
     memcpy (d + s1len, s2, s2len);    // pass 2, over s2
    d[s1len + s1len] =  '\0';          // nul-terminate result

03
使用sprintf和snprintf進(jìn)行連接


出于對代碼復(fù)雜性和可讀性的擔(dān)心,程序員們有時會使用snprintf函數(shù)進(jìn)行字符串連接。
    
snprintf (d, dsize,  "%s%s", s1, s2);
這樣做代碼的可讀性非常好,但是,由于snprintf的開銷相當(dāng)大,它的低效率導(dǎo)致它可能比使用字符串函數(shù)慢幾個數(shù)量級。snprintf的開銷不僅是由于解析格式字符串,而且還由于格式化I/O函數(shù)實現(xiàn)中通常固有的復(fù)雜性。
一些編譯器(如GCC和Clang)試圖通過將非常簡單的sprintf和snprintf調(diào)用轉(zhuǎn)換為strcpy或memcpy調(diào)用以提高效率,避免了對I/O函數(shù)的某些調(diào)用的開銷(請參閱這個在線示例https://godbolt.org/z/RaWkyd)。然而,由于C庫中沒有等價的字符串函數(shù),而只有當(dāng)snprintf調(diào)用被證明不會導(dǎo)致輸出的截斷時,轉(zhuǎn)換才會完成,因此對snprintf的相應(yīng)轉(zhuǎn)換很少能夠發(fā)生。memcpy本身不合適,因為它復(fù)制的字節(jié)數(shù)與指定的字節(jié)數(shù)完全相同,strncpy也不適合,因為它把目標(biāo)字符串的最后的NUL結(jié)束符之后的位數(shù)都覆蓋了。
由于字符串的冗余傳遞次數(shù),將snprintf調(diào)用轉(zhuǎn)換為strlen和memcpy調(diào)用序列產(chǎn)生的額外開銷,也被視為得不償失。在這個頁面上,標(biāo)題為Better builtin string functions部分列出了GCC優(yōu)化器在這方面的一些限制,以及改進(jìn)它的一些折中措施。

04
POSIX的stpcpy和stpncpy函數(shù)


為了幫助解決這個問題,在過去很多年里出現(xiàn)了很多超出標(biāo)準(zhǔn)C的庫解決方案。POSIX標(biāo)準(zhǔn)包括stpcpy和stpncpy函數(shù),這兩個函數(shù)的實現(xiàn)方法是如果找到NUL結(jié)束符,則返回指向該字符的指針。這些函數(shù)可以用來緩解上面提到的麻煩和低效率。
    
const charstpcpy (charrestrictconst charrestrict);
     const charstpncpy (charrestrictconst charrestrictsize_t);
特別是,在不考慮緩沖區(qū)溢出的情況下,可以像下面這樣調(diào)用stpcpy來連接字符串:
    
stpcpy (stpcpy (d, s1), s2);
然而,當(dāng)字符串副本必須以目標(biāo)大小為邊界時,等效地使用stpncpy并不會消除將第一個NUL字符之后的剩余目標(biāo)位置清零并直到邊界指定的最大字符位置的開銷。
    
char *ret = stpncpy (d, dsize, s1);    // zeroes out d beyond the end of s1
    dsize -= (ret - d);
    stpncpy (d, dsize, s2);                // again zeroes out d beyond the end
所以,這個函數(shù)仍然效率低下,因為對它的每次調(diào)用都會將目標(biāo)中剩余的空間以及復(fù)制的字符串的末尾的空間清零。因此,這個操作的復(fù)雜性仍然是二次方的。效率低下的嚴(yán)重程度隨著目標(biāo)的大小成比例地增加,而與被連接的字符串的長度成反比增加。

05
OpenBSD的strlcpy和strlcat函數(shù)


為了應(yīng)對針對strcpy和strcat函數(shù)的弱點以及上面討論的strncpy和strncat的一些缺點的緩沖區(qū)溢出攻擊,OpenBSD項目在20世紀(jì)90年代末引入了一對替代API(strlcpy和strlcat),旨在使字符串復(fù)制和連接更加安全(http://www.open-std.org/jtc1/sc22/wg14/www/docs/n2349.htm)。
    
size_t strlcpy ( charrestrictconst  charrestrictsize_t);
     size_t strlcat ( charrestrictconst  charrestrictsize_t);
strncpy和strlcpy函數(shù)之間的主要區(qū)別在于返回值:前者返回指向目標(biāo)的指針,后者則返回復(fù)制的字符數(shù)。另一個區(qū)別是strlcpy函數(shù)總是在目標(biāo)中只存儲一個NUL結(jié)束符。要連接s1和s2,可以按以下方式使用strlcpy函數(shù):
    
size_t n = strlcpy (d, s1, dsize);
     dsize -= n;
     d += n;
     strlcpy (d, s2, dsize);
這使得strlcpy在使用性和簡單性方面都可以與snprintf相提并論(當(dāng)然snprintf的開銷雖然恒定,但要大得多)。
除了OpenBSD以外,strlcpy和strlcat函數(shù)在其他系統(tǒng)上也可用,包括Solaris和Linux(在BSD兼容庫中)。但是由于這些系統(tǒng)不是由POSIX指定的,所以這兩個函數(shù)在那些系統(tǒng)中并不總是存在。

06
POSIX的memccpy函數(shù)


POSIX還定義了另一個函數(shù)memccpy,該函數(shù)具有上面討論過的所有理想屬性,可以用來解決上面的問題。
    
voidmemccpy (voidrestrict dst, const voidrestrict src, int c, size_t n);
這個函數(shù)結(jié)合了memcpy、memchr的特性以及上面討論的API的最佳方面的特性。
  • 和memchr一樣,它會掃描源序列以查找由其參數(shù)之一指定的字符的第一次出現(xiàn)。字符可以是任何值,包括零。

  • 和strlcpy一樣,它最多將指定數(shù)量的字符從源序列復(fù)制到目標(biāo)序列,而不會寫入超出其范圍。這解決了有關(guān)strncpy和stpncpy的低效率的報怨。

  • 和stpcpy和stpncpy類似(盡管不完全相同),它返回一個指針,該指針指向指定字符的副本(如果存在)的后一位。(回想一下stpcpy和stpncpy返回一個指向復(fù)制的NUL的指針。)這避免了strcpy和strncpy固有的低效性。

因此,可以使用memccpy重寫上面的第一個示例(strcat(strcpy(d,s1,s2))以避免在字符串上進(jìn)行任何冗余傳遞,如下所示。請注意,這里使用SIZE_MAX作為大小限制,這個重寫無法避免原始示例中存在的目標(biāo)緩沖區(qū)溢出的風(fēng)險,因此應(yīng)避免。
    
memccpy (memccpy (d, s1,  '\0', SIZE_MAX) -  1, s2,  '\0', SIZE_MAX);
為了避免緩沖區(qū)溢出的風(fēng)險,需要為每個調(diào)用確定適當(dāng)?shù)拇笮∠拗撇⒆鳛閰?shù)提供。因此,像在snprintf(d, dsize, "%s%s", s1, s2)函數(shù)中那樣限制目標(biāo)大小的連接調(diào)用,可以像下面這樣計算目標(biāo)大小:
    
char *p = memccpy (d, s1,  '\0', dsize);
     dsize -= (p - d -  1);
     memccpy (p -  1, s2,  '\0', dsize);

07
選擇一個解決方案


如果字符串函數(shù)返回指向最后一個存儲字符或它的后面一位的指針,而不是返回其第一個參數(shù)的值,則上面討論的效率問題可以得到解決。然而,在現(xiàn)有函數(shù)使用了接近半個世紀(jì)后,對其進(jìn)行更改是不太可行的。
盡管解決現(xiàn)有C標(biāo)準(zhǔn)字符串函數(shù)的問題是不可行的,但是可以通過添加一個或多個不受相同限制的函數(shù)來在新代碼中緩解這個問題。由于C標(biāo)準(zhǔn)的章程正在對現(xiàn)有的實踐進(jìn)行編纂整理,所以C語言標(biāo)準(zhǔn)化委員有義不容辭的責(zé)任調(diào)查這種功能是否已經(jīng)存在于流行的實現(xiàn)中,如果已經(jīng)存在,則應(yīng)該考慮采納它們。如上文提到的這幾種解決方案。
在上面提到的解決方案中,memccpy函數(shù)是最通用和最高效的,它由ISO 標(biāo)準(zhǔn)支持。即使在POSIX標(biāo)準(zhǔn)實現(xiàn)之外,它的應(yīng)用范圍最廣,爭議最小。
相比之下,stpcpy和stpncpy函數(shù)的通用性較差,stpncpy函數(shù)會產(chǎn)生不必要的開銷,因此無法達(dá)到既定的目標(biāo)。這些函數(shù)在C2X中仍然值得采用,以提高移植性。詳情請參閱N2352–將stpcpy和stpncpy添加到C2X中的提案。
OpenBSD的strlcpy和strlcat函數(shù)雖然是最優(yōu)的,但是它們的通用性較差,支持范圍也較低,而且沒有得到ISO標(biāo)準(zhǔn)的指定。
memccpy函數(shù)不僅存在于Unix實現(xiàn)的子集中,它還由另一個名為ISO/IEC 9945的ISO標(biāo)準(zhǔn)指定。ISO/IEC 9945還有另外一個名字,也即大家熟知的IEEE Std 1003.1, 2017版,或者簡言之- POSIX: memccpy,在那里它是作為XSI擴(kuò)展提供給C的。這個函數(shù)可以追溯到System V接口定義第1版(SVID1),最初于1985年發(fā)布。
memccpy甚至可以用于UNIX和POSIX以外的實現(xiàn),例如:
  • 安卓系統(tǒng)中的memccpy函數(shù),

  • 蘋果Mac OS X中的memccpy函數(shù),

  • BlackBerry Native SDK 的memccpy函數(shù),

  • Compaq Run-Time Library for VAX中的memccpy函數(shù),

  • 微軟Visual Studio C Runtime Library中的 memccpy 函數(shù),

  • IBM z/OS 中的memccpy函數(shù).

下面提供了一個簡單(但是效率低下)的memccpy參考實現(xiàn): 
    
  voidmemccpy (voidrestrict dst, const voidrestrict src, int c, size_t n)
      
{
         void *pc =  memchr (src, c, n);
         void *ret;

         if (pc)
        {
          n = ( char*)pc - ( char*)src +  1;
          ret = ( char*)dst + n;
        }
         else
          ret =  0;

         memcpy (dst, src, n);
         return ret;
      }
這個函數(shù)的一個更優(yōu)化的實現(xiàn)可能如下。    
    
  voidmemccpy (voidrestrict dst, const voidrestrict src, int c, size_t n)
      
{
         const  char *s = src;
         for ( char *ret = dst; n; ++ret, ++s, --n)
        {
          *ret = *s;
           if (( unsigned  char)*ret == ( unsigned  char)c)
             return ret +  1;
        }
         return  0;
      }
借助于memccpy的性能優(yōu)化,編譯器將能夠把對snprintf (d, dsize, "%s", s)函數(shù)的簡單調(diào)用轉(zhuǎn)換為對memccpy(d, s, '\0', dsize)的最佳有效調(diào)用。通過以代碼大小換取速度,激進(jìn)的優(yōu)化器甚至可以將符合下列條件的snprintf函數(shù)調(diào)用(其格式字符串由多個%s指令組成,這些指令中間穿插有普通字符,如%s/%s)轉(zhuǎn)換成一系列的此類memccpy函數(shù)調(diào)用:如下所示   
    
char *p = memccpy (d, s1,  '\0', dsize);
       if (p)
      {
         --p;
        p = memccpy (p,  "/"'\0', dsize - (p - d));
         if (p)
        {
           --p;
          p = memccpy (p, s2,  '\0', dsize - (p - d));
        }
      }
       if (!p)
        d[dsize -  1] =  '\0';

08
2019年4月WG14會議后的更新


將memccpy函數(shù)和本文討論的其他標(biāo)準(zhǔn)函數(shù)(除了strlcpy和strlcat),以及另外兩個標(biāo)準(zhǔn)函數(shù)納入下一個C編程語言修訂版的提議于2019年4月提交給了C語言標(biāo)準(zhǔn)化委員會(見 3, 4, 5和 6)。委員會最終決定采納memccpy函數(shù),但否決了其余提案。
原文:https://developers.redhat.com/blog/2019/08/12/efficient-string-copying-and-concatenation-in-c/
-END-



推薦閱讀



【01】Rust能夠取代C語言嗎?
【02】C語言指針終極指南?。ǜ皆敱M圖示和代碼)
【03】如何把C++的源程序改寫成C語言
【04】17條嵌入式C語言編程小知識總結(jié)
【05】一文教你搞懂C語言的Q格式使用

免責(zé)聲明:整理文章為傳播相關(guān)技術(shù),版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系刪除

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

嵌入式ARM

掃描二維碼,關(guān)注更多精彩內(nèi)容

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉