搜索 社区服务 统计排行 帮助
  • 3947阅读
  • 28回复

x264在AMD上的那个bug

楼层直达
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 15楼 发表于: 2009-01-16
引用
最初由 vempx 发布
x264 [info]: using cpu capabilities: MMX2 SSE2Slow

就算我用的是X2 4000+,但是这指令集怎么这么少,明明有SSE3的啊


写上了又怎么样,x264不用SSE3的,SSE3主要是浮点指令。
其实SSE3有几条指令还是能用在整数处理上的,不过大部分CPU上比SSE2还慢。

实际上用得最多的还是MMX和SSE2,其他素浮云
级别: 骑士
注册时间:
2005-01-04
在线时间:
0小时
发帖:
1138
只看该作者 16楼 发表于: 2009-01-16
[/ku] SSE2后面还跟了个slow……

I've Sound音樂聯盟(点击进入)

[CHN][IFS][eDtoon][TLF][VeryCD]VempX <= eMule的ID,欢迎查看共享文件
~My Blog~
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 17楼 发表于: 2009-01-17
引用
最初由 vempx 发布
[/ku] SSE2后面还跟了个slow……


Phenom以前的AMD上SSE2的确很慢啊,有些时候用MMX反而快一些。

感觉x264开发者是I饭(或者Intel给了好处?),给Intel写了大量针对性的优化,对AMD基本上就是很笼统的优化。
级别: 骑士
注册时间:
2005-01-04
在线时间:
0小时
发帖:
1138
只看该作者 18楼 发表于: 2009-01-17
痛苦死我了,我现在的4000+OC到了2.6G,单核压704x480的DVDRip速度只有2.5帧左右……OTL

I've Sound音樂聯盟(点击进入)

[CHN][IFS][eDtoon][TLF][VeryCD]VempX <= eMule的ID,欢迎查看共享文件
~My Blog~
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 19楼 发表于: 2009-01-17
引用
最初由 vempx 发布
痛苦死我了,我现在的4000+OC到了2.6G,单核压704x480的DVDRip速度只有2.5帧左右……OTL


你什么参数,我的sempron 2500+ OC 2.0G 也一般在5fps以上啊。
级别: 骑士
注册时间:
2005-01-04
在线时间:
0小时
发帖:
1138
只看该作者 20楼 发表于: 2009-01-17
--crf 18 --level 4.1 --keyint 240 --min-keyint 24 --ref 8 --mixed-refs --no-fast-pskip --bframes 6 --b-adapt 2 --b-pyramid --weightb --subme 9 --trellis 2 --psy-rd 0.0:0 --partitions p8x8,b8x8,i4x4,i8x8 --8x8dct --me umh --merange 32 --threads 1 --thread-input --aq-mode 1

有点EP的参数……

I've Sound音樂聯盟(点击进入)

[CHN][IFS][eDtoon][TLF][VeryCD]VempX <= eMule的ID,欢迎查看共享文件
~My Blog~
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 21楼 发表于: 2009-01-17
那这个慢是你自找的
像merange 32和trellis 2性价比很差啊
还有thread-input在单核上没必要吧
级别: 骑士
注册时间:
2005-01-04
在线时间:
0小时
发帖:
1138
只看该作者 22楼 发表于: 2009-01-17
是啊,所以说这个参数很EP嘛……囧

thread-input是做什么用的?对这个参数说实话我完全不了解~

另外那个merange很神奇,对画面影响非常大,我以前试过16 20 24 32这几个参数压chobits,发现并不是越大越好,说不准哪个好……囧

I've Sound音樂聯盟(点击进入)

[CHN][IFS][eDtoon][TLF][VeryCD]VempX <= eMule的ID,欢迎查看共享文件
~My Blog~
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 23楼 发表于: 2009-01-17
引用
最初由 vempx 发布
是啊,所以说这个参数很EP嘛……囧

thread-input是做什么用的?对这个参数说实话我完全不了解~

另外那个merange很神奇,对画面影响非常大,我以前试过16 20 24 32这几个参数压chobits,发现并不是越大越好,说不准哪个好……囧


thread-input是开启输入缓冲,多核上可以提高CPU利用率,单核上除了多占内存没任何作用。

merange最小可以设到4
级别: 骑士
注册时间:
2005-01-04
在线时间:
0小时
发帖:
1138
只看该作者 24楼 发表于: 2009-01-17
弄到4之后回事什么样子

原来那个东西在单核上没用。
[/KH] 反正我内存4G,开了就开了…………

I've Sound音樂聯盟(点击进入)

[CHN][IFS][eDtoon][TLF][VeryCD]VempX <= eMule的ID,欢迎查看共享文件
~My Blog~
级别: 骑士
注册时间:
2006-09-22
在线时间:
0小时
发帖:
965
只看该作者 25楼 发表于: 2009-01-17
速度乃是浮云..
对这方面已经麻痹了.

级别: 圣骑士
注册时间:
2003-02-20
在线时间:
79小时
发帖:
1605
只看该作者 26楼 发表于: 2009-01-17
以前amd那些cpu就不适合压片,现在叫人家换平台也没动力啊,优化当然少

嗯。。。
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 27楼 发表于: 2009-01-17
引用
最初由 vempx 发布
弄到4之后回事什么样子

原来那个东西在单核上没用。
[/KH] 反正我内存4G,开了就开了…………


对速度有影响的,虽然不大。线程同步要多消耗资源,使用buffer会导致cache miss增加同样会降低速度。
级别: 骑士
注册时间:
2005-01-04
在线时间:
0小时
发帖:
1138
只看该作者 28楼 发表于: 2009-01-17
引用
最初由 roozhou 发布


对速度有影响的,虽然不大。线程同步要多消耗资源,使用buffer会导致cache miss增加同样会降低速度。

感谢解答,以后threads 1的时候就关掉它

I've Sound音樂聯盟(点击进入)

[CHN][IFS][eDtoon][TLF][VeryCD]VempX <= eMule的ID,欢迎查看共享文件
~My Blog~
快速回复

限150 字节
上一个 下一个