取消 提交

自定义博客皮肤

-+

姜兴琪的博客

种一棵树最好的时间是十年前,其次是现在

我也要用
排序:
按最后发布时间
按访问量
RSS订阅

原创 AI人工智能算法解析&落地实践专栏列表

汽车之家推荐系统排序算法迭代之路:https://xingqijiang.blog.csdn.net/article/details/10672214058同城 | Embedding技术在房产推荐中的应用:https://xingqijiang.blog.csdn.net/article/details/106684161[论文解读]微信看一看实时Look-alike推荐算法:https://xingqijiang.blog.csdn.net/article/details/103293456Fac

2020-06-13 10:12:15 1533 2

原创 Leetcode No.5 最长回文子串

给定一个字符串 s,找到 s 中最长的回文子串。你可以假设s 的最大长度为 1000。示例 1:输入: "babad"输出: "bab"注意: "aba" 也是一个有效答案。示例 2:输入: "cbbd"输出: "bb"方法一:暴力匹配 (Brute Force)根据回文子串的定义,枚举所有长度大于等于 22 的子串,依次判断它们是否是回文;在具体实现时,可以只针对大于“当前得到的最长回文子串长度”的子串进行“回文验证”;在记录最长回文子串的时候,可以只记录“当前子串的起始.

2020-08-02 22:21:59 164

原创 Leetcode No.4 寻找两个正序数组的中位数

给定两个大小为 m 和 n 的正序(从小到大)数组nums1 和nums2。请你找出这两个正序数组的中位数,并且要求算法的时间复杂度为O(log(m + n))。你可以假设nums1和nums2不会同时为空。示例 1:nums1 = [1, 3]nums2 = [2]则中位数是 2.0示例 2:nums1 = [1, 2]nums2 = [3, 4]则中位数是 (2 + 3)/2 = 2.5思路:简单粗暴,先将两个数组合并,两个有序数组的合并也是归并排...

2020-08-02 01:01:54 265

原创 潘石屹用Python解决100个问题 | 分解质因数

如何将一个正整数分解质因数?例如输入90,打印出90=2*3*3*5#如何将一个正整数分解质因数?例如输入90,打印出90=2*3*3*5n=int(input("输入一个正整数=:"))for k in range(2,n+1): while n!=k: if n%k==0: print(k,end="*") n=n/k else: breakprint(int(n))...

2020-07-30 15:17:25 308

原创 潘石屹用Python解决100个问题 | 字符类型统计

输入任意一个字符串,如何才能得到空格、数字、字符和“其他”的个数?#输入任意一个字符串,如何才能得到空格、数字、字符和“其他”的个数?abc=input("string=")abc_dict={"space":0,"digit":0,"alpha":0,"others":0}for i in abc: if i.isspace() == True: abc_dict["space"] += 1 elif i.isdigit() == True: a

2020-07-30 14:20:10 248

原创 潘石屹用Python解决100个问题 | 水仙花数(Narcissistic number)

水仙花数(Narcissistic number)是指一个三位数,它的每个位上的数字的3次幂之和等于它本身。水仙花数是自幂数的一种。通过计算水仙花数可以练习编程水平。问题:如何求出所有三位正整数中的水仙花数?for i in range(100,1000): a=str(i) if int(a[0])**3+int(a[1])**3+int(a[2])**3==i: print(i)...

2020-07-29 16:26:39 296

原创 Leetcode No.3 无重复字符的最长子串

给定一个字符串,请你找出其中不含有重复字符的最长子串的长度。示例1:输入: "abcabcbb"输出: 3解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。示例 2:输入: "bbbbb"输出: 1解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。示例 3:输入: "pwwkew"输出: 3解释: 因为无重复字符的最长子串是"wke",所以其长度为 3。 请注意,你的答案必须是 子串 的长度,"pwke"是一个子序列,不是子串...

2020-07-28 01:05:14 523 2

原创 潘石屹用Python解决100个问题 | 最小公倍数

最小公倍数是一个小学算术的概念,两个或多个整数公有的倍数叫做它们的公倍数,其中除0以外最小的一个公倍数就叫做这几个整数的最小公倍数。num_1=int(input("number_1=?"))num_2=int(input("number_2=?"))lcm=max(num_1,num_2)while True: if lcm%num_1==0 and lcm%num_2==0: break else: lcm+=1print("{}和{}的最.

2020-07-27 23:27:10 397

原创 潘石屹用Python解决100个问题 | 最大公约数

最大公约数是一个小学算术的概念,还常常被用在社会学中,用来形容人们之间形成的最大共识,如“共通的意义空间”等说法。如何用程序来求任意两个数的最大公约数?num_1=int(input("number_1=?"))num_2=int(input("number_2=?"))gcd=1a=min(num_1,num_2)for i in range(1,a+1): if num_1%i==0 and num_2%i==0: gcd=i;print("{}和{}的最大公约数

2020-07-27 23:20:20 379

原创 潘石屹用Python解决100个问题 | 倒计时

“倒计时”在我们日常生活中随处可见,比如:交通标志、开工仪式、庆祝活动、 火箭升空。但最戏剧化的还是电影 007 中定时炸弹的倒计时,还有《三体》中的倒计时信号。今天的问题是:输入一个目标时间(包括年、月、日、时、分、秒),如何写出从当前时间开始到目标时间的倒计时?from datetime import datetimeimport osimport timetime_format='%Y-%m-%d %H:%M:%S'time_1=input(time_format)target = d

2020-07-26 19:30:26 1232

原创 Leetcode No.2 两数相加

给出两个非空 的链表用来表示两个非负的整数。其中,它们各自的位数是按照逆序的方式存储的,并且它们的每个节点只能存储一位数字。如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。您可以假设除了数字 0 之外,这两个数都不会以 0开头。示例:输入:(2 -> 4 -> 3) + (5 -> 6 -> 4)输出:7 -> 0 -> 8原因:342 + 465 = 807方法:初等数学思路我们使用变量来跟踪进位,并从包含最低...

2020-07-26 12:12:27 497

原创 潘石屹用Python解决100个问题 | 素数

素数(又名质数),即只能被数字 1 和??整除、且?于 1 的?然数。公元前 300多年,古希腊数学家欧??得就证明了有多个素数的存在。素数是“哥德巴赫猜想”等许多数学猜想的基础。问题:如何列出 1 到 100 的素数数列,并计算出素数的个数?number=0for n in range(1,101): for j in (2,n+1): if n%j==0: break else: number+=1 prin

2020-07-24 19:50:19 516

原创 潘石屹用Python解决100个问题 | 企业根据利润提成发奖金

今天跟朋友们一起学习“企业根据利润提成发奖金”的问题。当利润(I)低于或等于10万元时,奖金可提10%;当利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.5%;当20万到40万之间时,高于20万元的部分,可提成5%;当40万到60万之间时高于40万元的部分,可提成3%;当60万到100万之间时,高于60万元的部分,可提成1.5%;当高于100万元时,超过100万元的部分按1%提成。问题是求应发放奖金总数是多少?p_1=int(input("输入利润=(万

2020-07-23 21:04:58 603

原创 潘石屹用Python解决100个问题 | 排列组合

有四个数字为:1、2、3、4,他们能组成多少个互不相同、且无重复数字的三位数?分别是多少?count=0for i in range(1,5): for j in range(1, 5): for k in range(1, 5): if i!=j and j!=k and k!=i: print(i,j,k) count+=1print("共有%d个数字符合条件" %count).

2020-07-23 20:46:08 563

原创 NLP | 搜索文本的匹配算法

搜索即找到跟搜索词句很相似的文本,例如在百度中搜索"人的名",结果如下那么怎么评价两个文本之间的相似度呢?余弦相似度 (cosine similiarity)本文介绍基于VSM(Vector Space Model) 的余弦相似度算法来评价两个文本间的相识度。余弦相似度,又称为余弦相似性。通过计算两个向量的夹角余弦值来评估他们的相似度。两个空间向量之间的夹角越小,我们就认为这两个向量越吻合,cosθ 越大,当完全重合时 cosθ = 1由余弦定律可知:(原谅我百...

2020-07-17 18:26:13 795

原创 机器学习 | 牛顿冷却定律

牛顿冷却定律:定义了温度随时间变化的规律。#T_now:当前温度#T_last: 上次温度#tx:与上次测量的时间间隔#coefficient: 冷却系数T_now= T_last * Exp(-(tx) * coefficient)可见,随着时间温度会慢慢下降,并且下降的速度越来越慢,一直到最后几乎不变 。热门排名温度冷却,自然而然就会想起“热门推荐”或者“热门排名”,那么是否可以使用上述的公式来做热门排名呢?答案是肯定的。本次热门分值 = 上次统计热门分...

2020-07-17 17:54:06 705

原创 python菜鸟教程 | if elif else 判断

上一讲主要学习了if else内容,本讲将要学习最后一个语句elif(else if)。基本使用if condition1: true1_expressionselif condition2: true2_expressionselif condtion3: true3_expressionselif ... ...else: else_expressions如果有多个判断条件,那可以通过elif语句添加多个判断条件,一旦某个条件为...

2020-07-17 15:38:52 702

原创 潘石屹用python解决100个问题 | 斐波那契数列

今天跟大家一起学习一个经典数列:黄金分割数列。意大利数学家斐波那契(Fibonacci)十二世纪就发现了它,后人用他的名字命名这个数列,即:1, 1, 2, 3, 5, 8, 13, 21,…,这个数列前两项都是1,从第3项开始,每一项都等于前两项之和。随着数列的增加,前一项与后一项的比值逼近0.6180339887这个黄金分割系数。在大自然中,斐波那契数列经常出现在我们面前,比如松果、海螺、凤梨、向日葵,在植物的叶、枝和茎中也能发现它的存在,这些都是大自然中神奇的、美丽的数学表达。今天的问题是:如何用Py

2020-07-17 15:29:06 736

转载 微信「看一看」多模型内容策略与召回

看一看介绍相信对于不少人而言微信已经成为获取资讯的主要场景。与此同时,由于微信用户群体的庞大,也吸引了大量的内容生产者在微信公共平台创造内容,以获取用户关注、点赞、收藏等。微信内的内容推荐产品:看一看应运而生。基于微信通过多年的用户沉淀,积累得到的大量“隐式反馈”阅读兴趣信息,可以精准的实现内容与内容消费者之间的推荐。同时,秉承降低用户获取信息茧房效应,拓宽用户阅读兴趣,增强互动,强化用户认知,及时获取咨询等等诉求,看一看不断在算法迭代的同时,引入各类腾讯系,外部图文,视频,资讯,小视频..

2020-07-17 11:00:16 724

转载 58同城 Elasticsearch 应用及平台建设实践

导读:Elasticsearch是一个分布式的搜索和分析引擎,可以用于全文检索、结构化检索和分析,并能将这三者结合起来。Elasticsearch基于Lucene开发,现在是使用最广的开源搜索引擎之一。Elasticsearch可以应用于在/离线日志流水、用户标签画像、数据库二级缓存、安全风控行为数据、图数据库索引、监控数据、Wiki文档检索等应用场景。58同城有自己的主搜,而一些内部创新搜索业务和大规模的数据实时OLAP ( On-Line Analytical Processing,联机分析处理 ) 则

2020-07-16 17:47:35 708

原创 python菜鸟教程 | if else 判断

上一讲我们学习了if语句,这一样我们将要学习if else语句。基本使用if condition: true_expressionselse: false_expressions当if判断条件为True,执行true_expressions语句; 如果为False,将执行else的内部的false_expressions。实例x = 1y = 2z = 3if x > y: print('x is greater ...

2020-07-16 17:34:26 678

原创 潘石屹用python解决100个问题 | 数据类型

1、程序a=2a=str(a)print("a的值是=",a,"a的类型是:",type(a))a=float(a)print("a的值是=",a,"a的类型是:",type(a))a=int(a)print("a的值是=",a,"a的类型是:",type(a))b=3print("a==b",a==b,type(a==b))print("a>b",a>b,type(a>b))print("a<b",a<b,type(a<b))2、运行结果

2020-07-16 17:27:03 669

原创 潘石屹用Python解决100个问题 | 葵花绘图

程序的主要逻辑部分是2层循环。2个循环的内循环,是画一个正方形 即画笔向前画100个像素,形成一条边。然后画笔转动90度,是个直角,再画100个像素,形成第二条边。这样话4次就组成了一个正方形。 而外层的循环,每次沿顺时针方向移动10度,然后再调用内层循环画正方形。代码:import turtleimport timemyPen=turtle.Pen()myPen.speed(0)myPen.pencolor('red')myPen.fillcolor('yellow')myPen

2020-07-15 10:59:45 738

原创 python菜鸟教程 | if 判断

除了常见的循环控制语句,Python 中还有if,if else和if elif等判断语句,本讲将简单介绍if语句基本使用与其他编程语言中的if语句一样,使用方法如下if condition: expressions如果condition的值为True,将会执行expressions语句的内容,否则将跳过该语句往下执行。实例x = 1y = 2z = 3if x < y: print('x is less than y...

2020-07-13 16:55:56 694

原创 python菜鸟教程 | for 循环

在上一讲中我们学习了 while 语句进行循环控制,接下来我们将要学习另一种循环语句 for 。基本使用不同编程语言都有 for 语言,比如 C# 语言中的foreach, Java 语言中的for,在 Python 中的基本使用方法如下。for item in sequence: expressionssequence为可迭代的对象,item为序列中的每个对象。实例example_list = [1,2,3,4,5,6,7,12,543,876,12,3,...

2020-07-09 17:27:03 716

原创 python菜鸟教程 | while 循环

在 Python 语言中用来控制循环的主要有两个句法,while和for语句,本讲将简单介绍while句法的使用。基本使用while 语句同其他编程语言中 while 的使用方式大同小异,主要结构如下while condition: expressions其中condition为判断条件,在 Python 中就是True和False其中的一个,如果为True, 那么将执行exexpressions语句,否则将跳过该 while 语句块接着往下执行。...

2020-07-08 14:12:31 768

原创 潘石屹用Python解决100个问题 | 奥运五环

使用Python画奥运五环1、效果图2、代码import turtleimport timemyPen=turtle.Pen()myPen.speed(0)myPen.pensize(5)circle_pos=[(0,0),(100,0),(50,-55),(-50,-55),(-100,0)]colors=["black","red","green","yellow","blue"]continent_name=["非洲","美洲","大洋洲","亚洲","欧洲"]con

2020-07-06 00:22:11 829

原创 潘石屹用Python解决100个问题 | 乘法口诀

使用Python打印乘法口诀效果图:python代码:for i in range(1,10): for j in range(1,i+1): print("%d*%d=%-2d"%(i,j,i*j),end=" ") print(" ")

2020-07-05 23:37:21 787

转载 TikTok抖音国际版留存背后的数据和算法推演

导读:最近在朋友组织的创业群听到了一些前辈和同行讨论的话题,收获很大,拿出来分享给大家。这个话题就是TikTok在美国的留存率一年之内取得了大幅上涨,有哪些地方做对了呢?本文将站在算法工程师的角度做一些个人的猜想和推演,不吝拙见,以求抛砖引玉,望不妥之处请批评指正。01 部分结论:TikTok的大幅上涨来源1. 供给侧 ( 努力 ) 内容量大幅提升:主要来自于开放跟拍权限,加上低门槛创作工具和爆款内容的持续引流。 内容审核效率的提升:机器审核准确率提高。 2. 运营侧 ( 努力

2020-07-05 17:32:45 1039

原创 Leetcode No.1 两数之和

给定一个整数数组 nums和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]package twosum;import java.util.HashMap;import java.util.Map;...

2020-07-05 01:16:52 818

转载 抖音与快手用户增长策略的“破“与“不破“

圈层的外扩是非常难的事情,并且做得不好容易给产品"原住民"带来伤害,有时候需要慢慢探索。但是今天抖音、快手竞争激励,谁能快速跑马圈地触碰用户对外战局影响深远,更何况腾讯今天对于新的流量入口,虎视眈眈,大家都正在被推着走。快手与抖音在原有圈层穿透、做深,打通原有圈层的各类平行圈层,还必须做到自上而下、自下而上的贯穿。这里面战略上得在围绕圈层穿透想办法,战术上除了引入明星、电影独家播放权、冠名春晚,试图在用户、内容层面拥抱新用户圈层以外,也在尝试留住这些拉进门的新朋友。接下来我们从用户的生命周期上,结合数据

2020-07-04 19:46:07 971

原创 python菜鸟教程 | 变量 variable

自变量命名规则可以将一个数值,或者字符串串附值给自变量,如apple=1中,apple为自变量的名称,1为自变量的值。 也可以将字符串赋值给自变量apple='iphone7 plus'apple=1 #赋值 数字print(apple)""""1""""apple='iphone 7 plus' #赋值 字符串print(apple)""""iphone 7 plus""""如果需要用多个单词来表示自变量,需要加下划线,如apple_2016='...

2020-07-01 16:19:57 755

原创 python菜鸟教程 | 基础数学运算

基本的加减乘除python可以直接运算数字,也可以加print进行运算.>>> 1+12>>> 2-11>>> 2*36>>> 4/31.3333333333333333^ 与 **python当中^符号,区别于Matlab,在python中,^用两个**表示,如3的平方为3**2,**3表示立方,**4表示4次方,依次类推>>> 3**2 # **2 表示2次方...

2020-06-30 17:38:00 819

原创 一线算法工程师经典面试题

一、机器学习基础题1、LSTM的公式2、RNN为什么出现梯度消失及BPTT的推导3、DQN的基本原理么4、GBDT和随机森林有什么区别5、GBDT的原理,如何做分类和回归6、随机森林的随机体现在哪方面7、Wide &Deep的原理8、GBDT+LR是怎么做的?9、DQN模型为什么要做经验回放10、数据之间如果不是独立同分布的会怎样11、AUC的原理介绍一下12、XGBOOst和GBDT的区别。13、强化学习和监督学习的区别14、神经网络里面的损

2020-06-29 17:46:54 1229

原创 geckodriver、selenium、firefox版本对应关系

官方文档:https://firefox-source-docs.mozilla.org/testing/geckodriver/Support.htmlgeckodriver Selenium Firefox min max 0.26.0 ≥ 3.11 (3.14 Python) 60 n/a 0.25.0 ≥ 3.11 (3.14 Python) 57 n/a 0.24.0 ≥ 3.11 (3.14 Python) 5

2020-06-29 10:44:58 1285

原创 最小推荐系统:协同过滤(Collaborative Filtering)

当UGC/PUGC社区发展到一定规模,需要从人工推荐(热门榜单、编辑推荐等策略)转向算法推荐信息流展示给用户。在这个阶段,我们会遇到推荐系统的冷启动问题,表现在两个方面:1)一般意义的冷启动:新用户(或者新条目)到来的时候,没有用户行为记录,因而算法无法预测其兴趣爱好;2)之前的人工推荐信息流导致社区信息的生产端(Item,条目)和消费端(User,用户)的分布都过于头部化,生产端的头部条目用户几乎都消费过,而腰部条目用户几乎都没有消费过。这种情况下关于条目和用户的描述都过于稀疏化。我们希...

2020-06-22 20:09:21 823

原创 Leetcode No.42 接雨水

题目链接:https://leetcode-cn.com/problems/trapping-rain-water给定n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度图,在这种情况下,可以接 6 个单位的雨水(蓝色部分表示雨水)。示例:输入: [0,1,0,2,1,0,1,3,2,1,2,1]输出: 6方法 1:暴力直观想法直接按问题描述进行。对于数组..

2020-06-20 20:23:42 881

原创 L0、L1、L2范数在机器学习中的应用

正则化在机器学习中经常出现,但是我们常常知其然不知其所以然,今天将从正则化对模型的限制、正则化与贝叶斯先验的关系和结构风险最小化三个角度出发,谈谈L1、L2范数被使用作正则化项的原因。??首先我们先从数学的角度出发,看看L0、L1、L2范数的定义,然后再分别从三个方面展开介绍。L0范数指向量中非零元素的个数L1范数:向量中每个元素绝对值的和 L2范数:向量元素绝对值的平方和再开平方应用一:约束模型的特性1.1 L2正则化——让模型变得简单例如我们给下图的点建立一个模型:

2020-06-20 15:11:00 812

原创 linux tar命令详解

tar支持将多个文件包成一个文件,同时还可通过gzip/bzip将该文件压缩。目前window的winRAR也支持.tar.gz文件解压。一、参数说明说明: -c/-x/-t/u 不可同时出现参数 参数说明 -c 新建打包文件,同 -v 一起使用 查看过程中打包文件名 -x 解决文件, -C 解压到对应的文件目录。 -f 后面接要处理的文件 -j 通过bzip2方式压缩或解压,最后以.tar.br2 为后缀。压缩后大小小于.tar.gz -z

2020-06-19 20:47:21 803

转载 汽车之家推荐系统排序算法迭代之路

导读:汽车之家的推荐系统紧随前沿技术,在支持内部多个推荐场景的同时,对外也有了一定的输出。未来我们期望汽车之家的推荐系统不只是前沿技术的应用者,更是推动者和创新者。本次分享的主题为汽车之家推荐系统排序算法迭代之路,主要包括:汽车之家推荐系统排序模型特征及训练样本未来计划的优化方向01. 汽车之家推荐系统1.概述汽车之家推荐系统上线已有近5年历史,主要给用户推荐个性化的汽车之家资源。推荐系统的上线是汽车之家 APP 生态内容以分类体系分发转变为个性化推荐的重要里程碑。汽车之家推荐..

2020-06-12 19:07:19 890

提示
确定要删除当前文章?
取消 删除