登录 立即注册

找到9619个回复

加勒比海带 9楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-23 13:05//)

膜拜大佬!
https://www.chengyao.xyz

老虎会游泳 8楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-23 01:41//)

@无名啊,github的markdown解析器应该也是这样啊,用空行隔开的段落会被转换为<p></p>,无论中间有多少空行都只会生成一对<p></p>

所以实际上根本没有生成换行,你在这里看到的隔行效果只是<p></p>的边距。

如果你就是想要多个换行,可以使用[br]


这是[br]叠加<p></p>的效果。

无名啊 7楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-23 00:26//)

@老虎会游泳,上一楼,想每段隔多几行回复来着。咋连续多行,被压缩成一行了。。

无名啊 6楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-23 00:26//)

@老虎会游泳

std::cin >> word这个io可能比较慢

确实,我改成 std::getline(std::cin, word) 后,就由 28 秒 → 25 秒了。

你可以自行统计一下分段用时,看看输入、计算和输出各占比多少。

我简单测了测,读取 1 亿 15 长度字符串用时。

  • std::cin >> word:5.1 秒
  • std::getline(std::cin, word):2.2 秒
  • 手动开 64KB 缓冲区,每次 std::cin.read() 填充,std::memchr\nstr.append() 构造:1.4 秒

感觉输入上,这速度也可以了。

而且,我 strace 了一下 DuckDB,它也是要读到缓冲区里的,且缓冲区贼大,32MB。。且一定要填充完整 32MB,才干活。。

怪不得我说,一边解压大文本/脚本实时生成内容,一边喂给 DuckDB,怎么耗时会变长。。明明 writer 产生内容的速度还挺快的呀。。

也许输入输出是大头(因为stdio是同步锁定的)

我取消与 stdio 同步了:std::ios::sync_with_stdio(false);

这个确实很耗时间。不取消的话,总时间直接翻倍。。

把文件mmap到内存然后使用char*指针直接访问

如果想解压大文本,再通过管道喂给程序时,好像不能 mmap 了吧。。

ponyoung 3楼回复 老虎会游泳Pura70Pro+微距摄影:看看不同屏幕的子像素排列方式 (04-22 22:54//)
可喜可贺,奇怪的姿势增加了
老虎会游泳 2楼回复 老虎会游泳Pura70Pro+微距摄影:看看不同屏幕的子像素排列方式 (04-22 22:15//)
老虎会游泳 4楼回复 张小强关于4月1日起未备案app不得联网,rom底层限制了吗? (04-22 22:13//)

@张小强,不清楚,没人举报的话应该不会有事。

上善若水 1楼回复 老虎会游泳Pura70Pro+微距摄影:看看不同屏幕的子像素排列方式 (04-22 22:12//)

恭喜老虎喜提华为Pura 70 Pro+一部。
一加ace2Pro(灰|24+1024)

张小强 3楼回复 张小强关于4月1日起未备案app不得联网,rom底层限制了吗? (04-22 22:00//)
@老虎会游泳,webview应该不受影响吧
hik 2楼回复 张小强关于4月1日起未备案app不得联网,rom底层限制了吗? (04-22 14:00//)

国外服务器的应该不影响

老虎会游泳 1楼回复 张小强关于4月1日起未备案app不得联网,rom底层限制了吗? (04-22 12:53//)

是通过服务器网站备案的形式进行限制,由服务器提供商进行app备案验证及http/tls阻断,类似普通网站备案。

NowTime 47楼回复 NowTime[已解决] [求助] Intel 以太网卡 公网下载速度被限制在 30Mbps 左右(理论需要达到 300+Mbps) (04-22 10:17//)

@老虎会游泳,有可能是这样

老虎会游泳 94楼回复 老虎会游泳向日葵控控A2(OrayKVM)U盘救砖/USB恢复模式说明/免U盘刷机教程 (04-22 09:31//)

@chenml4,那是我在电脑上装的Linux系统,不是控控。

老虎会游泳 46楼回复 NowTime[已解决] [求助] Intel 以太网卡 公网下载速度被限制在 30Mbps 左右(理论需要达到 300+Mbps) (04-22 09:28//)

@NowTime,你说刚开始没问题后来才慢的对吧,也可能是旧的坏了,只是没全坏,开机功能正常但是会干扰其他PCI-e设备

chenml4 93楼回复 老虎会游泳向日葵控控A2(OrayKVM)U盘救砖/USB恢复模式说明/免U盘刷机教程 (04-21 21:54//)
@老虎会游泳,感谢虎哥,请问77楼是怎么登陆的呀~
削枝铅 4楼回复 爱特​红魔9Pro/Pro+全系可以软解Bootloader了 (04-21 20:45//)

可以 618就换这个了 小米现在解锁太麻烦了
小米6高配版(黑色)

NowTime 45楼回复 NowTime[已解决] [求助] Intel 以太网卡 公网下载速度被限制在 30Mbps 左右(理论需要达到 300+Mbps) (04-21 17:58//)

@老虎会游泳@烟雨,破案了,看起来是开机卡问题,但是我当时用别的 pcie 网卡插上去,也是会影响网速的。

后面买了另外一个开机卡就没问题 ,难道是 Intel B660 芯片组的问题吗

Snipaste_2024-04-21_17-51-37.png(1.83 MB)

艾木友尔尔巴 5楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-21 07:25//)
层主 @艾木友尔尔巴 于 2024-04-21 07:25 删除了该楼层。
老虎会游泳 4楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-21 02:54//)

@无名啊,你可以自行统计一下分段用时,看看输入、计算和输出各占比多少。也许输入输出是大头(因为stdio是同步锁定的)。

老虎会游泳 3楼回复 无名啊用 C++ 写了个简单的词频统计,为啥比 DuckDB 还慢一半呢。。 (04-21 02:50//)

@无名啊std::cin >> word这个io可能比较慢,把文件mmap到内存然后使用char*指针直接访问每行的内容可能更快,跳转到下一行就是上一行的指针加上一行的字节数。

下一页 上一页 (4 / 481页)

5月17日 17:47 星期五

本站由hu60wap6华为CPU驱动

备案号: 京ICP备18041936号-1