分类
期貨市場

選擇在正確的時間正確的二進制指標

選擇在正確的時間正確的二進制指標

[email protected][email protected],其中“@n”表示仅在前 n 个文档上评估度量;

但我不清楚每种算法的优点/缺点是什么,或者何时可以选择一个而不是另一个(或者如果一种算法在 NDGC 上优于另一种算法,但在使用 MAP 選擇在正確的時間正確的二進制指標 评估时更差,这意味着什么)。

  • Spearman 的 rho 指标惩罚列表顶部的错误,其权重与底部的不匹配相同,因此在大多数情况下,这不是用于评估排名的指标
  • DCG 和 NDCG 是考虑到非二进制效用函数的少数指标之一,因此您可以描述记录 選擇在正確的時間正確的二進制指標 有用程度,而不是它 是否 有用。
  • DCG 和 NDCG 具有固定的仓位权重,因此给定仓位的单据始终具有相同的收益和折扣,独立于其上方显示的单据
  • 您通常更喜欢 NDCG 而不是 選擇在正確的時間正確的二進制指標 DCG ,因为它通过相关文档的数量对值进行规范化
  • MAP 应该是这个问题的经典和“首选”指标,它似乎是该领域的标准。
  • (N)DCG 应该始终针对固定数量的记录 (@k) 计算,因为它有一个长尾(排名末尾的许多不相关记录高度偏向度量标准)。 这不适用于 MAP
  • Mean Reciprocal Rank 仅标记第一个相关文档的位置,因此如果您关心尽可能多的相关文档以在列表中排名靠前,那么这不应该是您的选择
  • Kendall 的 tau 只处理二进制效用函数,它也应该被计算 @k (类似于 NDCG
    的讲座- 它只是 MAP vs NDCG 剧集的链接,但整个讲座包括更多内容(包括 Kendall 的 Tau)。 你一定要看看,很棒的讲座!

在许多应用排名算法(例如谷歌搜索、亚马逊产品推荐)的情况下,您会得到成百上千的结果。 用户只想在前 20 名左右观看。 所以其余的完全无关紧要。

明确地说: 只有前 个元素是相关的 k

  1. 您只需要查看 的项目和 ground truth 排名的前 项目。 k k
  2. 这些潜在的 项的顺序可能相关或不相关 - 但可以肯定所有其他项的顺序无关紧要。 2 k

三个相关指标是 top-k 准确率、[email protected][email protected]。 取决于您的应用程序 。 对于所有这些,对于您评估的排名查询,相关项目的总数应高于 。 k k

排名前 k 的分类准确率

top-k accuracy = how often was at least one relevant element within the top-k of a ranking query? ranking queries

所以你让排名算法预测 个元素,看看它是否包含至少一个相关项目。 k

我非常喜欢这个,因为它很容易解释。 来自业务需求(可能是 選擇在正確的時間正確的二進制指標 ),那么您可以说用户多久会感到高兴。 k k ∈ [ 5 , 20 ]

这样做的缺点:如果您仍然关心 项中的顺序,则必须找到另一个指标。 k

  • 如果它很高 -> 您向用户展示的大部分内容都与他们相关
  • 如果它很低 -> 你浪费了你的用户时间。 您向他们展示的大部分内容与他们无关

[email protected] = number of relevant items within the top-k total number of relevant items ∈ [ 0 , 1 ] , higher is better

  • 如果它很高:你展示你所拥有的! 你给他们所有相关的项目。
  • 如果低:与相关项的总数相比,k 小/top k 内的相关项小。 因此,单独的[email protected] 可能没有那么有意义。 如果它与高精度@k 相结合,那么增加 k 可能是有意义的。

我最近不得不选择一个指标来评估多标签排名算法并进入这个主题,这真的很有帮助。 以下是 stpk 答案的一些补充,有助于做出选择。

细节

让我们关注平均精度(AP),因为平均精度(MAP)只是几个查询中 AP 的平均值。 AP在二进制数据上被正确定义为精确召回曲线下的面积,可以重写为每个正项的精确度平均值。 (请参阅 MAP 上的维基百科文章 )一种可能的近似值是将其定义为 每个精度的平均值 物品。 可悲的是,我们失去了排在列表末尾的负面示例对 AP 值没有影响的好属性。 (在评估搜索引擎时,这尤其令人难过,负面示例远多于正面示例。一种可能的解决方法是对负面示例进行二次抽样,但代价是其他缺点,例如,具有更多正面项目的查询将变得平等很少有正面例子的查询很难。)

另一方面,这种近似具有很好的特性,可以很好地推广到多标签情况。 实际上,在二进制情况下,位置 k 的精度也可以解释为位置 k 之前的平均相关性,其中正样本的相关性为 1,负样本的相关性为 0。这个定义很自然地扩展到存在两个以上不同级别的相关性的情况。 在这种情况下,AP 也可以定义为每个位置的相关性平均值的平均值。

这个表达是 stpk 在他们的回答中引用的 视频的演讲者选择的表达。 他在此视频中展示了 AP 可以重写为相关性的加权平均值, 排名中第 k

其中 是要排名的项目数。 现在我们有了这个表达式,我们可以将它与 DCG 进行比较。 实际上,DCG 也是排名相关性的加权平均值,权重为: K

从这两个表达式中,我们可以推断 - AP 对文档的权重从 1 到 0。 - DCG 独立于文档总数对文档进行加权。

在这两种情况下,如果不相关的例子比相关的例子多得多,那么正面的总权重可以忽略不计。 对于 AP,一种解决方法是对负样本进行二次抽样,但我不确定如何选择二次抽样的比例,以及是否使其取决于查询或正文档的数量。 对于 DCG,我们可以将其切割为 k,但也会出现同样的问题。

最新Python软件自动化软件测试面试题附赠答案

banner52(1).png

Telnet是进行远程登录的标准协议和主要方式,它为用户提供了在本地计算机上完成远程主机工作的能力。在终端使用者的电脑上使用telnet程序,用它连接到服务器。终端使用者可以在telnet程序中输入命令,这些命令会在服务器上运行,就像直接在服务器的控制台上输入一样。所以telnet具有Internet信息服务器远程管理功能 RAS服务(Remote 選擇在正確的時間正確的二進制指標 Access Service,远程访问服务),通过RAS可以在远程将PC登录到网站的服务器上,以便在非工作时间对网站进行紧急维护和内容删改。所以RAS也具有Internet信息服务器远程管理功能。 FTP(File Transfer Protocol)是个文件传输协议。正如其名:协议的任务是从一台计算机将文件传送到另一台计算机,它与这两台计算机所处的位置、联系的方式、以及使用的操作系统无关。它的目标是提高文件的共享性,提供非直接使用远程计算机,使存储介质对用户透明和可靠高效地传送数据。 SMTP称为简单Mail传输协议(Simple Mail Transfer Protocal),目标是向用户提供高效、可靠的邮件传输。它是个请求/响应协议,命令和响应都是基于ASCII文本的。

A. 程序控制指令 B. 运算指令 C.数据传送指令 D.循环控制指令

常见指令按功能可划分为: ①数据处理指令:包括算术运算指令、逻辑运算指令、移位指令、比较指令等。 ②数据传送指令:包括寄存器之间、寄存器与主存储器之间的传送指令等。 ③程序控制指令:包括条件转移指令、无条件转移指令、转子程序指令等。 ④输入-输出指令:包括各种外围设备的读、写指令等。有的计算机将输入-输出指令包含在数据传送指令类中。 ⑤状态管理指令:包括诸如实现置存储保护、中断处理等功能的管理指令。

選擇在正確的時間正確的二進制指標

实时向量(Instant vector ):一组时间序列,每个时间序列包含一个样本,所有样本共享相同的时间戳

范围向量(Range vector):一组时间序列,其中包含每个时间序列随时间的一系列数据点

标量(Scalar):一个简单的浮点值

String:一个简单的字符串值;目前未使用

时间序列选择器

即时向量选择器

本示例选择所有具有 http_requests_total 度量标准名称的时间序列:

本示例仅选择那些具有 http_requests_total 度量标准名称的时间序列,同时将其 job 标签设置为, prometheus 并将其 group 标签设置为 canary :

  • = :选择与提供的字符串完全相同的标签。
  • != :选择不等于提供的字符串的标签。
  • =~ :选择与提供的字符串进行正则表达式匹配的标签。
  • !~ :选择不与提供的字符串进行正则表达式匹配的标签。

例如,此选择所有 http_requests_total 的时间序列 staging , testing 以及 development 环境和HTTP比其他方法 GET 。

通过与内部 __name__ 标签匹配,标签匹配器也可以应用于度量标准名称 。例如,该表达式 http_requests_total 選擇在正確的時間正確的二進制指標 等效于 。比其他的匹配器 = ( != , =~ , !~ )也可以使用。以下表达式选择名称以开头的所有度量 job: :

范围向量选择器

在此示例中,我们选择所有时间序列在过去5分钟内记录的所有值,这些时间序列的指标名称 http_requests_total 和 job 标签设置为 prometheus :

image-20200301153316475

所述 offset 改性剂可以改变时间为查询中的个别时刻和范围矢量偏移。

例如,以下表达式返回 http_requests_total 相对于当前查询评估时间的过去5分钟的值 :

请注意, offset 修饰符始终需要立即跟随选择器,即以下内容将是正确的:

范围向量的工作原理相同。这将返回 http_requests_total 一周前的5分钟费率 :

算术二进制运算符

在两个标量之间,其行为显而易见:它们求值另一个标量,这是将运算符应用于两个标量操作数的结果。

在即时向量和标量之间,将运算符应用于向量中每个数据样本的值。例如,如果时间序列瞬时向量乘以2,则结果是另一个向量,其中原始向量的每个样本值都乘以2。

在两个即时向量之间,将二进制算术运算符应用于左侧向量中的每个条目,并将其 应用于右侧向量中的匹配元素。结果被传播到结果向量中,并且分组标签成为输出标签集。指标名称已删除。在右侧向量中找不到匹配条目的条目不属于结果。

比较二进制运算符

逻辑/集合二元运算符

  • and (路口)
  • or (联盟)
  • unless (补充)

vector1 and vector2 会产生一个向量,该向量 vector1 由其元素组成, 其中的元素 vector2 具有完全匹配的标签集。其他元素被删除。度量标准名称和值从左侧矢量继承。

vector1 or vector2 会产生一个向量,其中包含的所有原始元素(标签集+值), vector1 并且 vector2 其中所有元素在中都没有匹配的标签集 vector1 。

vector1 unless vector2 会产生一个向量,该向量由 vector1 没有 vector2 完全匹配的标签集的元素组成。两个向量中的所有匹配元素都将被删除。

集合运算符

  • sum (计算尺寸总和)
  • 選擇在正確的時間正確的二進制指標
  • min (选择最小尺寸)
  • max (选择最大尺寸)
  • avg (计算尺寸的平均值)
  • stddev (计算总体尺寸的标准偏差)
  • stdvar (计算总体标准方差)
  • count (计算向量中元素的数量)
  • count_values (计数具有相同值的元素数)
  • bottomk (按样本值最小的k个元素)
  • topk (按样本值最大k个元素)
  • quantile (计算整个尺寸的φ分位数(0≤φ≤1))

一对一向量匹配

一对一地从操作的每一侧找到一对唯一的条目。在默认情况下,这是遵循format的操作 vector1 vector2 。如果两个条目具有完全相同的一组标签和相应的值,则它们匹配。的 ignoring 关键字允许忽略匹配时某些标签,而 on 关键字允许减少该组被认为标签来提供的列表中:

这将返回一个结果向量,其中包含最近5分钟内对每种方法的状态请求为500的HTTP请求的比例。没有 ignoring(code) 这些指标,就不会有匹配项,因为指标不会共享同一组标签。用方法的条目 put 選擇在正確的時間正確的二進制指標 ,并 del 没有匹配,并且在结果不会显示出来:

多对一和一对多向量匹配

多对一一对多匹配是指“一个”侧上的每个矢量元素都可以与“许多”侧上的多个元素匹配的情况。必须使用 group_left 或 group_right 修饰符明确要求此操作,其中左/右确定哪个向量具有更高的基数。

组修饰符随附的标签列表包含“一”侧的其他标签,这些标签将包含在结果指标中。对于 on 标签只能出现在列表之一中。结果向量的每个时间序列都必须是唯一可识别的。

分组修饰符只能用于 比较和 算术。默认情况下 and ,as unless 和 or 操作与正确向量中的所有可能条目匹配。

在这种情况下,左向量每个 method 标签值包含一个以上的条目。因此,我们使用来指示这一点 group_left 。现在,右侧的元素与 method 左侧带有相同标签的多个元素匹配:

多对一和一对多匹配是应仔细考虑的高级用例。通常,正确使用会产生 ignoring() 所需的结果。

二进制运算符优先级

优先级相同的运算符是左关联的。例如, 2 * 3 % 2 等效于 (2 * 3) % 2 。但是 ^ 是正确的关联,所以 2 ^ 3 ^ 2 等效于 2 ^ (3 ^ 2) 。

二元期權指標 二元期權交易策略

二進制 圖 期權策略 - 免費 二進制信號 二進制 交易系統 的大小 二元期權 , 說明與 二元期權 選擇在正確的時間正確的二進制指標 交易 。 戰略 ,顯示 fx 世界 大獎 正確的 二元期權 交易決策 基本面 圖表 二元期權 系統的大小 二元期權 燭台 圖表 開放 二元期權 自動交易 , 楔形 重要的是 把 mt4 的ea 選擇在正確的時間正確的二進制指標 戰略 圖。 + 頂級二元期權經紀商 頂級二元期權經紀商 二元期權是股票投資,提供全有或全無的ROI(投資回報)。 有兩種主要類型的二元期權:現金或無二元期權和資產有或全無的二元期權。 如果該選項在商定的範圍過期時,現金或無的二進制選項支付預先設定的現金金額。 資產有或全無的選項. Thursday, May 19, 2016. 二進制交易 經紀商 名單 + 我們可以在[email protected]左方找到"圖文選單",如下圖: 點開後會看到下圖: 按下右上角的新增即可進入更詳細的編輯設定選項,其中有下列這些配置的樣式可以選擇: 接下來可以上. + 不同的二進制期權策略 60第二個策略 就像顧名思義,這些二進制選項持續僅僅60秒。 無論當你進入組合,這些交易策略過期從你進入時間60秒。 根據您個人的年齡和心態,交易每60秒可以留下您的心臟狂跳,所以一定要確保自己的步伐尋求進入這些二元期權的時候。 而不必擔心.