cpu-architecture

    0热度

    1回答

    像我们有在此基础上该数据被复制到缓存,但谁是负责这个参考局部性。 有任何H/W或有任何S/F其中执行此操作?

    2热度

    1回答

    我正在学习缓存行,以及循环跨步对缓存的影响。我遇到了this页面,其中显示了循环与循环步幅的执行时间。根据基准,增加循环跨度会减少执行时间,这对我来说非常困惑。据我了解,如果缓存行是64字节,并假设如果在第一种情况下循环步长是1,这意味着循环顺序遍历数组元素,那么应该有最少的执行时间,因为16个整数(4byte x 16 = 64字节)被加载到缓存中。由于所有16个元素都被加载到同一个缓存行中,因

    0热度

    1回答

    PC内存模块包含512k字。 Word有64位。二进制指令有四个段:间接位,操作码,寄存器代码部分,用于确定32个寄存器和地址部分之一。指令二进制代码存储在字存储器中。 操作码,寄存器代码和地址段需要多少位? 间接:1个比特 寄存器:5(2^5 = 32) 地址:19(2^19 = 512K) 操作码= 64 - 5 - 19 = 40位 我想我的回答是正确的,但实际上操作码不能有40位。 (这是

    0热度

    1回答

    绘制5级管线图时如何绘制数据依赖关系等待?我的答案是否正确? 说明 1. ADD X, Y, Y 2. ADD Z, Y, X 3. SUB V, X, W 4. ADD Z, Z, V 这里是管道图 是我的管线图是否正确?

    0热度

    1回答

    下面是示例(我已将它们预先转换为十进制)。 A为01000001000010000000000000000000^2(十进制8.5) B为01000000000100000000000000000000^2(十进制2.25) 的((+ A) - (+ B))应该是6.25十进制。 正常化A和B以及匹配的指数。 A = 1.00010 * 2^3 B = 0.01001 * 2^3 我可以如下在纸上

    0热度

    1回答

    Hamacher通过计算机组织。 ,我开始了解指示的基本步骤和操作。 以下是汇编代码 ADD RC,RA,RB 和指令如下 - : 1.Fetch the Instruction and increament the PC. 2.Decode the instruction and read Registers RA and RB 3.Compute [RA]+[RB](Executing I

    0热度

    3回答

    的性能在Patterson经历计算机组织时,我遇到了一个问题,我完全陷入困境。问题是: 假设我们知道同时使用桌面客户​​端和远程服务器的应用程序受网络性能的限制。对于以下更改,说明只有吞吐量有所提高,响应时间和吞吐量都会提高,或者两者都不会提高。 而做出的更改是: 更多的内存添加到计算机 如果我们增加更多的内存,不应该吞吐量和执行时间会提高? 吞吐量:工作在给定的时间内完成量 要清楚的吞吐量和响应

    0热度

    1回答

    理论上我有英特尔8086,我想执行这个指令: add [2000], 6 (or in AT&T syntax: addw $6, 2000) 我也知道:在2000值 是2 在3000是寄存器CS 在6000是寄存器DS 在1000是寄存器IP 现在我想在这个CPU中描述机器周期:执行&执行。 我知道它的外观在理论上: 取: 从内存中取出指令 解码指令,以确定操作是否必要 从内存中获取数据 执

    0热度

    1回答

    我将在Python中创建示例,因为我使用Python,但问题不在于Python。 可以说我想通过特定的值增加一个变量,使它保持在给定的边界。 所以对于增量和减量我有这两种功能: def up (a, s, Bmax): r = a + s if r > Bmax : return Bmax else : return r def down (a, s, Bmin)

    0热度

    1回答

    我想知道通常存储标签的位置。我看到了一些标签和数据一起存储的标签数据缓存,当存储器地址有匹配的标签时,只有标签部分在访问数据部分之前被访问。另一方面,我看到完全分离的标签和数据高速缓存,分离的有效位和其他位。 我想知道哪种方法是常用的,以及这两种结构之间在性能或能效方面是否存在差异? 在此先感谢。