查看: 5382|回复: 2

恩智浦i.MXRT685微控制器Dhrystone性能实测

[复制链接]
  • TA的每日心情
    开心
    2025-7-11 08:53
  • 签到天数: 301 天

    连续签到: 2 天

    [LV.8]以坛为家I

    3873

    主题

    7477

    帖子

    0

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    39278
    最后登录
    2025-7-21
    发表于 2020-1-20 13:07:34 | 显示全部楼层 |阅读模式
     
    恩智浦i.MXRT685微控制器Dhrystone性能实测



           在前面的文章 i.MXRTxxx微控制器概览 里,痞子衡给大家简介过恩智浦半导体在2018年推出的全新跨界微控制器i.MX RTxxx系列,该系列第一款芯片i.MXRT600搭载一颗Cortex-M33控制内核和一颗Tensilica HiFi4 DSP处理内核,该芯片可在超低功耗边缘处理应用中实现高效本地音频预处理、沉浸式3D音频播放和支持语音的体验。今天痞子衡先为大家实测一下其Cortex-M33控制内核的性能,性能测试程序采用经典的Dhrystone算法。


      关于Dhrystone标准的基本知识,痞子衡之前专门写过一篇文章 微处理器CPU性能测试基准(Dhrystone) ,本篇就是基于了解Dhrystone基本知识之后的一次实践。来,让我们开始吧。


    一、准备工作
    1.1 硬件平台NXP i.MX RT600 EVK
      要开始实测i.MXRT600的Dhrystone,首先你得有一块开发板,恩智浦官网上有i.MXRT600配套的评估板,如下图所示,痞子衡今天用的就是这块板子,板载主芯片型号为iMXRT685EVKA。
    1.png
    1.2 集成开发环境IAR EWARM
      ARM Cortex-M微控制器的集成开发环境有很多,其中IAR EWARM凭借优良的特性备受广大工程师青睐,今天痞子衡就选用IAR作为软件环境,具体版本为IAR EWARM v8.32.2。


    1.3 官方软件开发包NXP MCUXpresso SDK
      在开始移植Dhrystone程序到i.MXRT685上之前,我们需要先有一个i.MXRT685的基本hello world的例程,当然我们可以对着数据手册自己从头写一个,但是这里痞子衡推荐使用官方软件开发包。

      注册并登录恩智浦官网,来到 MCUXpresso SDK Builder 页面,在"Select Development Board"里选择EVK-IMXRT685后点击Build MCUXpresso SDK后跳转到下一个页面,在"Developer Environment Settings"里选择IAR并点击Download SDK后便可得到SDK_2.5.0_EVK-MIMXRT685.zip,下面是痞子衡下载的开发包具体版本信息:
    2.png
    二、开始实测
    2.1 跑通hello world
      使用USB线连接电脑与板子的J5 USB口,此时在设备管理器应该可以看到USB虚拟的串口(EVK板载LPC-LINK2调试器内含USB转串口功能,如果看不到串口,请自行安装LPC-LINK2驱动)。
      打开前一步下载的开发包里的\SDK_2.5.0_EVK-MIMXRT685\boards\evkimxrt685\demo_apps\hello_world\iar\hello_world.eww工程,确认工程option里linker文件选择的是MIMXRT685Sxxxx_ram.icf,然后使用板载调试器直接将工程下载进主芯片的RAM运行。
      如果工程运行正常,你在串口调试助手(115200,8N1)里应该能看到"hello world."打印输出。


    2.2 移植Dhrystone程序
      以hello_world工程为基础,将从Roy Longbottom的网站下载到的classic_benchmarks.tar.gz包解压,将\classic_benchmarks\source_code\dhrystone2\路径下的如下所有源文件(.c或.h)全部拷贝到hello world工程目录下


    \classic_benchmarks\source_code\dhrystone2
                                              \dhry.h          --关于兼容性的原型定义
                                              \dhry_1.c        --主程序入口
                                              \dhry_2.c        --算法子程序
      将上面所有Dhrystone源文件全部添加进hello_world工程并将工程更名为dhrystone,然后再将工程中原主函数入口文件hello_world.c更名为dhrystone.c,此时基本Dhrystone工程就完成了。但注意此时工程无法编译,因为Dhrystone源文件还需要进一步修改。


    2.2.1 适配嵌入式平台
      我们下载的Dhrystone源码本用作在PC上运行的,所以源码里面有一些仅适用于PC上运行的代码,比如计时部分、文件I/O部分,需要将这些代码全部删除以适合在嵌入式平台运行。

      关于计时部分,需要删除dhry_1.c文件里的#include < time.h> 语句,并且删除dhry.h文件里跟TIME宏相关的如下代码:
    1. <font size="3" face="微软雅黑">#ifndef TIME
    2. #define TIMES
    3. #endif
    4. /* Use times(2) time function unless    */
    5. /* explicitly defined otherwise         */

    6. #ifdef TIMES
    7. #include <sys/types.h>
    8. #include <sys/times.h>
    9. /* for "times" */
    10. #endif</font>
    复制代码
    关于文件I/O部分,需要删除dhry_1.c文件里的#include < stdio.h> 语句,以及如下涉及文件I/O(主要是关于Dhry.txt的操作)的代码:
    1. <font size="3" face="微软雅黑">#include <stdio.h> // 需删除

    2. void main (int argc, char *argv[]) // 需更改为void main(void)
    3. {
    4.     // ...
    5.     // 以下代码需删除
    6.     /* Initializations */
    7.     if (argc > 1)
    8.     {
    9.         switch (argv[1][0])
    10.         {
    11.             case 'N':
    12.                 nopause = 0;
    13.                 break;
    14.             case 'n':
    15.                 nopause = 0;
    16.                 break;
    17.         }
    18.     }

    19.     if ((Ap = fopen("Dhry.txt","a+")) == NULL)
    20.     {
    21.         printf(" Can not open Dhry.txt\n\n");
    22.         printf(" Press Enter\n\n");
    23.         int g = getchar();
    24.         exit(1);
    25.     }

    26.     // ...
    27.     {
    28.         // ...
    29.         /************************************************************************
    30.          *                Add results to output file Dhry.txt                   *
    31.          ************************************************************************/
    32.         fprintf (Ap, " #####################################################\n\n");
    33.         fprintf (Ap, " Dhrystone Benchmark 2.1 %s via C/C++ %s\n", options, timeday);
    34.         // ...
    35.         fclose(Ap);
    36.     }
    37. }</font>
    复制代码
    2.2.2 板级初始化
      上一节里已经将dhry_1.c里面的main函数形参int argc, char *argv[]改成了void,由于dhrystone.c(原hello_world.c)里已有main函数,且该main函数中含有板级初始化代码,所以我们需要将dhry_1.c里的main函数更名(比如可更名为dhrystone()),使dhrystone源码作为子程序来调用,这样便于往不同MCU平台移植,最后直接dhrystone.c里的main函数中增加dhrystone()的调用即可。
    1. <font size="3" face="微软雅黑">// dhry_1.c文件中
    2. void main (void) // 需更改为void dhrystone(void)
    3. {
    4.     ...
    5. }

    6. // dhrystone.c文件中
    7. int main(void)
    8. {
    9.     /* Init board hardware. */
    10.     BOARD_InitPins();
    11.     BOARD_BootClockRUN();
    12.     BOARD_InitDebugConsole();

    13.     // 增加的dhrystone函数调用
    14.     dhrystone();

    15.     while (1)
    16.     {
    17.     }
    18. }</font>
    复制代码
    2.2.3 计时功能
      原dhry_1.c文件里的关于计时部分的代码应该做一些微调整,time.h头文件的包含应该去除,这是Windows系统里的头文件,start_time(), end_time()是基于time.h里clock_gettime()函数而封装的API,secs是用于记录时间差的变量,这些API和全局变量都可以保留,但需要用MCU里的计时器重新实现。
    1. <font size="3" face="微软雅黑">#include <time.h> // 需删除

    2. void dhrystone (void)
    3. {
    4.     // ...
    5.     do
    6.     {
    7.         start_time();
    8.         // ...
    9.         end_time();
    10.         User_Time = secs;
    11.     }
    12.     while (count >0);
    13. }</font>
    复制代码
    关于计时器,第一个想到的自然是Cortex-M内核里的SysTick,不过考虑到Dhrystone程序是要跑在300MHz的主频下,而SysTick计时器只有24bit,也就是说即使SysTick->LOAD设最大的reload值0xFFFFFF,也将每隔0.05592s(0x1000000/300MHz)产生一次SysTick中断,而Dhrystone程序至少要跑2s以上,在Dhrystone运行的2s内会产生35次(2/0.05592)SysTick中断,这无疑会降低Dhrystone得分,所以SysTick直接被pass。(备注:SysTick->CTRL[2]用于选择SysTick的时钟源,默认1'b0为Core Clock,1'b1为外部clock,暂未研究这里的外部clock在i.MXRT685上是否能用)。
      翻看i.MXRT685的参考手册,其支持的计时器种类很多,有CTIMER、SCT、MRT、UTICK、WWDT,就选择比较常用的32bit计时器CTIMER吧。
      之前下载的软件包里也有CTIMER的例程\SDK_2.5.0_EVK-MIMXRT685\boards\evkimxrt685\driver_examples\ctimer,打开simple_match_interrupt.c文件将其中CTIMER初始化相关代码放入新定义的timer_ctimer_init()函数中并在start_time()中调用timer_ctimer_init()一次以完成CTIMER初始化。
      此外还需要添加定义#define CLOCKS_PER_SEC (16000000),因为CTIMER选择的时钟源是16MHz。
    1. <font size="3" face="微软雅黑">#define CLOCKS_PER_SEC (16000000)

    2. volatile uint32_t s_timerHighCounter = 0;
    3. void ctimer_match0_callback(uint32_t flags)
    4. {
    5.     s_timerHighCounter++;
    6. }

    7. void timer_ctimer_init(void)
    8. {
    9.     ctimer_config_t config;

    10.     /* Use 16 MHz clock for the Ctimer2 */
    11.     CLOCK_AttachClk(kSFRO_to_CTIMER2);

    12.     CTIMER_GetDefaultConfig(&config);
    13.     CTIMER_Init(CTIMER, &config);

    14.     /* Configuration 0 */
    15.     matchConfig0.enableCounterReset = true;
    16.     matchConfig0.enableCounterStop = false;
    17.     matchConfig0.matchValue = (uint32_t)~0;
    18.     matchConfig0.outControl = kCTIMER_Output_Toggle;
    19.     matchConfig0.outPinInitState = false;
    20.     matchConfig0.enableInterrupt = true;

    21.     CTIMER_RegisterCallBack(CTIMER, &ctimer_callback_table[0], kCTIMER_SingleCallback);
    22.     CTIMER_SetupMatch(CTIMER, CTIMER_MAT0_OUT, &matchConfig0);
    23.     CTIMER_StartTimer(CTIMER);
    24. }

    25. void start_time(void)
    26. {
    27.     timer_ctimer_init();
    28.     s_timerHighCounter = 0;
    29. }

    30. void end_time(void)
    31. {
    32.     uint64_t retVal;
    33.     uint32_t high;
    34.     uint32_t low;
    35.     do
    36.     {
    37.         high = s_timerHighCounter;
    38.         low = CTIMER_GetTimerCountValue(CTIMER);
    39.     } while (high != s_timerHighCounter);
    40.     retVal = ((uint64_t)high << 32U) + low;
    41.    
    42.     CTIMER_StopTimer(CTIMER);

    43.     secs = retVal / (CLOCKS_PER_SEC * 1.0);
    44. }</font>
    复制代码
    2.2.4 串口打印功能
      串口打印功能的改动比较简单,直接把原dhry_1.c文件里的printf()全部替换成PRINTF()即可,PRINTF函数在原hello world工程里已经实现了。


    2.3 Dhrystone参数配置
      痞子衡在Dhrystone标准的基本知识介绍里说过,Dhrystone几乎没有参数配置,唯一需要注意的就是REG,Cortex-M33平台支持register关键字,所以我们在IAR工程option里宏定义框内加上 REG=register。
      此外我们还需要在宏定义框内设置额外两个宏 NUMBER_OF_RUNS、CORE_FREQ_MHz,前者代表跑dhrystone核心算法程序的总次数,后者是当前MCU实际运行主频。最后还需要设置一下IAR的优化选项,如下图所示:
    3.png
    2.4 输出Dhrystone结果
      到这里Dhrystone的移植工作就完全结束了,此时Dhrystone工程也应该能正常编译了。为得到最高的Dhrystone得分,最后需要再确定两件事:一、Core Clock是否确定配置为300MHz;二、工程代码段/数据段是否放在了SRAM。
      打开clock_config.c文件,查看BOARD_BootClockRUN()函数,ARM Core/AHB时钟仅保守地配了250MHz,让我们修改Pfd0的分频系数,从19修改为16,直接超频到300MHz。
    1. <font size="3" face="微软雅黑">void BOARD_BootClockRUN(void)
    2. {
    3.     // ...

    4.     CLOCK_InitSysPll(&g_configSysPll); /* Configure system PLL to 528Mhz. */
    5.     /* Valid PFD values are decimal 12-35. */
    6.     // 将分频系数修改16
    7.     // CLOCK_InitSysPfd(kCLOCK_Pfd0, 19); /* Enable main PLL clock 500MHz. */
    8.     CLOCK_InitSysPfd(kCLOCK_Pfd0, 16); /* Enable main PLL clock 594MHz. */

    9.     // ...

    10.     /* Let CPU run on SYS PLL PFD0 with divider 2. */
    11.     CLOCK_SetClkDiv(kCLOCK_DivSysCpuAhbClk, 2);
    12.     CLOCK_AttachClk(kMAIN_PLL_to_MAIN_CLK);

    13.     // ...
    14. }</font>
    复制代码
    再打开MIMXRT685Sxxxx_ram.icf文件,查看text/data段确实放在了SRAM里(0x0 - 0x47FFFF):

    1. <font size="3" face="微软雅黑">define symbol m_interrupts_start               = 0x00080000;
    2. define symbol m_interrupts_end                 = 0x00080143;

    3. define symbol m_text_start                     = 0x00080144;
    4. define symbol m_text_end                       = 0x001BFFFF;

    5. define symbol m_data_start                     = 0x001C0000;
    6. define symbol m_data_end                       = 0x002FFFFF;</font>
    复制代码
    还等什么?将Dhrystone工程赶紧下载进芯片并打开串口调试助手看Dhrystone得分啊。痞子衡实测的Dhrystone得分为411 DMIPS,1.37 DMIPS/MHz,这跟ARM官方公布的CM33内核Dhrystone得分1.5 DMIPS/MHz有点差距。
    4.png
    对于Dhrystone得分没上1.5 DMIPS/MHz,痞子衡当然不服,鉴于之前在 RT1052上测试CoreMark性能 的经验,我们知道低版本的IAR在速度优化上表现要更好,所以我们继续用IAR 7.80.4再测一遍,这一次得到了440 DMIPS,1.466 DMIPS/MHz,这才差不多接近ARM官方指标。
    5.png
    偷懒的朋友直接移步痞子衡的github http://github.com/JayHeng/Cortex-M-Apps 去下载移植好的工程,工程在\Cortex-M-Apps\apps\dhrystone_imxrt685\bsp\下面。






    作者:痞子衡

    qiandao qiandao
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2020-1-31 22:07
  • 签到天数: 29 天

    连续签到: 1 天

    [LV.4]偶尔看看III

    20

    主题

    385

    帖子

    19

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    2091
    最后登录
    2020-7-1
    发表于 2020-1-20 13:47:10 | 显示全部楼层
    这不是LPC系的芯片吗,怎么取了一个imx rt的名字
    该会员没有填写今日想说内容.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2025-7-11 08:53
  • 签到天数: 301 天

    连续签到: 2 天

    [LV.8]以坛为家I

    3873

    主题

    7477

    帖子

    0

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    39278
    最后登录
    2025-7-21
     楼主| 发表于 2020-1-20 15:43:38 | 显示全部楼层
    1209实验室@ujn 发表于 2020-1-20 13:47
    这不是LPC系的芯片吗,怎么取了一个imx rt的名字

    我去看一下
    qiandao qiandao
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 注册/登录

    本版积分规则

    关闭

    站长推荐上一条 /3 下一条

    Archiver|手机版|小黑屋|恩智浦技术社区

    GMT+8, 2025-7-22 01:03 , Processed in 0.091703 second(s), 22 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2024, Tencent Cloud.

    快速回复 返回顶部 返回列表