视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
SQLServerReplication常见错误
2020-11-09 07:38:32 责编:小采
文档


1. 错误: 已将此(这些)订阅标记为不活动,必须将其重新初始化。需要删除NoSync 订阅,然后重新创建它们 use distribution go -- 查找状态不正常的发布 select status, * from dbo.MSsubscriptions where status 2 -- 修改状态 update dbo.MSsubscriptions s

1. 错误:已将此(这些)订阅标记为不活动,必须将其重新初始化。需要删除NoSync 订阅,然后重新创建它们

use distribution
go
--查找状态不正常的发布
select status,*from dbo.MSsubscriptions where status<>2
--修改状态
update dbo.MSsubscriptions set status=2where status<>2

观察复制链是否能正常运行,正常后用tablediff比较发布链中的表数据是否一致
还可以重新初始化快照,但是数据量大就是个悲剧。

2. 错误:表、存储过程不存在以及表结构不一致等
处理方法:
a. 表或存储过程不存在:
在订阅端对应的库中补齐缺失的对象;

有一种比较奇怪的现象是订阅端表明明存在,但是同步链依然报错,此时可能有两种情况:
第一: 表字段不一致,可以参照下面(b)的方式补齐表字段;
第二: 表字段也一致,但是依旧报错,可以采取三种方式解决:
a. 暂停同步链,然后再次开启,看是否能通过,如果不行,进行下面的步骤;
b. 勾选掉同步链中报错的这个表,然后观察同步链,此时去掉了这个表的发布,错误一般都能过去,
等到所有数据同步后,再将这个表勾选上,一般都能过;同步链正常后,在用TableDiff工具比较下
这个表的数据;
c. 如果b步骤依然报错,那就只能重建了。


b. 列名'xxx' 无效
可以通过以下语句查找缺失的字段对应的表

--查找某个发布链中的某个字段(Rp_XXXX 发布名xxx 字段名)

select a.name as table_name,b.name as column_name,(select'alter table '+a.name+' add '+b.name+''+
(casewhen name='nvarchar'thencast(b.max_length/2ASvarchar)
when name like'date%'or name='money'then''
else name end )
from sys.types where system_type_id=b.system_type_id ) as definition FROM dbo.sysarticles a WITH(NOLOCK) innerjoin sys.columns b WITH(NOLOCK)
on a.objid=b.object_idinnerjoin dbo.syspublications c with(nolock) on a.pubid=c.pubid
where c.name='Rp_XXXX'and b.name='xxx'

3. 错误:.主键冲突
处理方法:跳过错误

错误完成后,需要比较两边数据是否一致(比下数据量就行了)

---------------跳过订阅机器上面的错误------------------------
-----------------------在分发机器上--------------------------
--语法
sp_helpsubscriptionerrors [ @publisher = ]'publisher'
, [ @publisher_db = ]'publisher_db'
, [ @publication = ]'publication'
, [ @subscriber = ]'subscriber'
, [ @subscriber_db = ]'subscriber_db'

--get publisher subscriber
select*from MSsubscriber_info

--get publisher_db publication subscriber_db=publisher_db
select*from MSpublications

--example
sp_helpsubscriptionerrors 'SQLw2k8','dbtranpub','dbtranpub_pub','SQLw2k8Subscriber','dbtransub'

--获取xact_seqno 值

----------------------在订阅机器上---------------------------
sp_setsubscriptionxactseqno [ @publisher= ]'publisher',
[ @publisher_db= ]'publisher_db',
[ @publication= ]'publication',
[ @xact_seqno= ] xact_seqno

--example
sp_helpsubscriptionerrors 'SQLw2k8','dbtranpub','dbtranpub_pub',xact_seqno

-------------------------------------------------------------------------------------

4. 错误:应用复制的命令时在订阅服务器上找不到该行

a. 可以采用“主键冲突”错误的处理方式,跳过错误,然后再用tablediff比较两个表的数据差;
b. 在订阅端补充缺失的数据

--使用如下语句找出错误号
selecttop100 e.xact_seqno ,e.command_id,e.*
from dbo.MSdistribution_history h
join dbo.MSrepl_errors e on h.error_id=e.id
where comments notlike'%transaction%'--失败的代理
orderby id desc

--用上面查到的具体事务序列号,查看复制组件执行的具体命令
--在分发数据库上执行:sp_browsereplcmds,注意必须限定开始和结束xact_seqno
sp_browsereplcmds '0x0000003B00000020000500000000','0x0000003B00000020000500000000'
--结果如下
article_id command
1 {CALL [dbo].[sp_MSdel_dboUPCCodeTransaction] ('000000002 ')}

--找到对应的对象
select publisher_db,article From dbo.MSarticles where article_id=1and publication_id=(
select publication_id from MSpublications with(nolock) where publication='Rp_xxx')

--由sp_MSdel 可以知道,这条命令是一个删除语句,因为发布端的数据已经不存在,所以只能跳过;

--如果是修改,需要验证上述数据在故障订阅服务器上是否存在,如果不存在,则补上。

5. 错误:用户'xxx' 登录失败或者The process could not connect to Subscriber 'xxxx'.
处理方法: 检查账号是否正确,能够登录到发布和订阅服务器,而且有相应的权限。

6. 发布'xxx' 的初始快照尚不可用
保证SQLSERVERAGENT已经运行,复制=》发布内容=》发布项目=》右击右侧的订阅=》重新初始化
如果还不行,复制监视器--发布服务器--xxx--发布的项目--快照,看到进程未能创建文件“\\XXZ\SQLPUB\unc”,
到该文件夹重新配置sql的帐号对该文件夹权限为"完全"。

7. 进程未能从表“[dbo].[syncobj_0x3745373834413345]”向外大容量复制
在写BCP 数据文件时发生I/O 错误(源: ODBC SQL Server Driver (ODBC); 错误代码: 0)
解决方法:就是字符类型全部改为n类型的解决问题(char-nchar,varchar-nvarchar,ntext).

8. 错误消息:
"代理'xxxx' 在出错后正在重试。已重试了25 次。有关详细信息,请参阅Jobs 文件夹中的代理作业历史记录。”

发生这个错误一般都是在一台机器上面有比较多的发布链,错误原因在于数据库对Replication使用内存的,
我们需要更改这个来解决这个问题(最好是不要再一台机器上创建太多的发布链),方法如下:

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\SubSystems\
点开Windows项,找到下面这些内容
%SystemRoot%\system32\csrss.exe ObjectDirectory=\Windows Shareddiv=1024,20480,768
将最后的数字(不一定是这个数字,可能是等)改成1024 保存,重启即可。

Windows2008 server 如果不是amdin用户可能会不让打开注册表,如果是管理组权限的话,可以到
C:\windows\system32 下面找到regedit32.exe 文件,右键,然后将自己的账号添加到运行权限里面。

9.--Cannot drop the database XXX because it is being used for replication
exec sp_removedbreplication 'database'

下载本文
显示全文
专题